올해 DeepSeek의 등장은 참 많은 말들을 만들어 냈습니다. 저가의 GPU와 사람의 노동력을 결합하여 개발된 제품, 오픈소스를 했으나 업데이트를 하려면 극도의 노동력을 갈아 넣어야 해서 불가능하단 허무함, 결국은 고가의 GPU의 사용을 피하기 위한 중국의 고육지책 그리고 결정적인 보안의 이슈가 터지기 시작했습니다. 터무니없이 많은 개인의 정보를 취합하고 EU 규정과 같은 합리적은 근거 없이 무단으로 취합하고 보관 역시 중국 서버에 이루어지기 때문에 기존에도 회사의 기밀자료는 업로드 제한이 있는 AI 검색엔진에 더욱 위험한 모습을 보여주고 있습니다. 이에 많은 국가와 기업 그리고 국내 기업 역시 DeepSeek사용 차단을 강제하고 있습니다. 이에 무슨 의미가 있는 것인지 한번 살펴보도록 하겠습니다.
목차
AI 기반 검색엔진이 발전하면서 사용자 정보 수집 방식과 개인정보 보호가 중요한 이슈가 되고 있다. ChatGPT(OpenAI)와 DeepSeek(중국 AI 검색엔진)은 AI를 활용하여 정보를 제공하지만, 데이터 수집 방식, 개인정보 보호 정책, 데이터 활용 방식에서 차이를 보인다. 보안의 문제가 제기되고 있는 현 시점에서 ChatGPT와 DeepSeek이 사용자 정보를 어떻게 수집하고 활용하는지 비교하고, 개인정보 보호 측면에서 어떤 차이가 있는지 살펴보려고 합니다.
1. ChatGPT의 사용자 정보 수집 방식
① ChatGPT의 검색 방식
ChatGPT는 AI가 직접 정보를 생성하여 답변하는 방식이다.
기존의 검색엔진처럼 웹페이지 목록을 나열하는 것이 아니라, GPT-4 Turbo 모델이 검색어에 대한 정보를 요약하여 응답한다. 유료 사용자(Plus)에게만 실시간 웹 브라우징 기능을 제공하며, AI가 검색한 정보의 출처를 항상 제공하는 것은 아니다.
② ChatGPT의 데이터 수집 방식
ChatGPT는 사용자의 입력 내용을 저장하고 AI 모델 개선을 위한 학습 데이터로 활용한다.
특히, 무료 사용자 데이터는 기본적으로 저장되며, 이를 통해 AI의 성능을 지속적으로 향상하는 데 사용된다.
다만, ChatGPT Plus 사용자(유료)는 데이터 저장을 비활성화할 수 있는 옵션이 제공된다.
수집하는 데이터는 다음과 같다.
- 사용자의 입력 내용(대화 기록)
- 사용자 계정 정보(이메일, 로그인 정보)
- AI 모델 개선을 위한 학습 데이터
- IP 주소 및 기기 정보
③ ChatGPT의 개인정보 보호 정책
ChatGPT는 개인정보 보호를 강화하기 위해 유럽연합(EU)의 GDPR(일반 데이터 보호 규정)을 준수하고 있다.
사용자가 요청하면 대화 기록 삭제가 가능하며, OpenAI는 광고 타겟팅을 위해 사용자 데이터를 활용하지 않는다.
ChatGPT의 개인정보 보호 정책을 정리하면 다음과 같다.
- 데이터 삭제 요청 가능 → 사용자가 원하면 대화 기록 삭제 가능
- 광고 기반 데이터 활용 없음 → 광고를 위해 검색 데이터를 수집하지 않음
- IP 및 기기 정보 일부 저장 → 로그인 시 사용자 기기 정보 저장 가능
ChatGPT는 AI가 생성한 답변을 제공하는 만큼, 검색 결과의 신뢰도와 출처 제공이 제한적인 점이 단점으로 꼽힌다.
또한, AI가 학습한 데이터에 따라 편향된 답변을 제공할 가능성이 있다.
2. DeepSeek의 사용자 정보 수집 방식
① DeepSeek의 검색 방식
DeepSeek은 중국에서 개발한 AI 기반 검색엔진으로, 실시간 웹 크롤링을 통해 정보를 분석하고 검색 결과를 제공하는 방식을 사용한다. AI가 검색 결과를 요약하여 제공하지만, 기존 검색엔진처럼 웹페이지 목록도 함께 표시되며 출처를 명확히 제공하는 것이 특징이다.
② DeepSeek의 데이터 수집 방식
DeepSeek은 사용자 검색 기록을 적극적으로 수집하며, 이를 활용해 맞춤형 검색 결과를 제공한다.
또한, 검색 키워드와 클릭한 링크 정보를 분석하여 사용자 프로필을 생성하고, 이를 바탕으로 개인화된 검색 경험을 제공한다. 수집하는 데이터는 다음과 같다.
- 사용자의 검색 키워드 및 클릭한 링크 정보
- 사용자의 IP 주소 및 위치 데이터
- 방문한 웹사이트 및 검색 기록
- 광고 최적화를 위한 사용자 행동 데이터
DeepSeek은 중국의 데이터 보안법을 준수하며, 모든 사용자 데이터를 중국 내 서버에서 저장 및 관리한다.
③ DeepSeek의 개인정보 보호 정책
DeepSeek은 중국 정부의 데이터 보안법을 준수하며, 사용자의 검색 데이터를 장기간 저장한다.
또한, 맞춤형 광고를 위해 수집된 데이터를 분석하고, 필요 시 정부 기관과 공유될 가능성이 있다.
DeepSeek의 개인정보 보호 정책을 정리하면 다음과 같다.
- 사용자 검색 데이터 저장 → 검색 이력 및 클릭한 링크 정보를 장기간 저장
- 맞춤형 광고 제공 → 검색 패턴을 분석해 개인 맞춤형 광고 노출
- 데이터 삭제 요청 제한적 → 사용자가 검색 기록 삭제를 요청할 수 있지만, 완전한 삭제가 보장되지 않음
DeepSeek은 맞춤형 검색과 광고 최적화에 강점이 있지만, 사용자의 개인정보 보호 측면에서는 상대적으로 불리한 구조를 가지고 있다.
3. ChatGPT vs DeepSeek 사용자 정보 수집 비교
앞서 2항과 3항의 내용을 요약한 비교테이블은 다음과 같이 요약을 해볼 수 있습니다.
비교 항목 | ChatGPT | DeepSeek |
검색 방식 | AI 생성 답변 제공 (GPT-4 Turbo) | AI 요약 및 실시간 웹 검색 |
실시간 웹 검색 | 유료 버전(Plus)만 가능 | 실시간 검색 가능 |
출처 제공 여부 | 일부 검색 결과에서만 제공 | 검색된 웹사이트 출처 제공 |
사용자 입력 데이터 저장 | 기본적으로 저장 (옵션 해제 가능) | 검색 프로필 생성 및 저장 |
IP 및 기기 정보 수집 | 제한적 수집 (로그인 시 적용) | IP, 위치 데이터, 검색 기록 저장 |
데이터 삭제 가능 여부 | 요청 시 삭제 가능 | 데이터 삭제 요청 제한적 |
광고 기반 데이터 활용 | 광고 없이 운영 | 맞춤형 광고 최적화 |
개인정보 보호 정책 | GDPR 준수, 데이터 보호 강화 | 중국 보안법 준수, 데이터 공유 가능성 있음 |
결과적으로 보면 DeepSeek측이 과도한 정보를 취합하고 있으며, 개인정보 보호 정책도 준수되지 않을 가능성이 높다는 판단이 적절해 보입니다. 더욱이 이러한 정보가 중국 서버에 저장된다는 것은 기업의 핵심 기술 및 군사 정보 수준까지도 중국 내에 보관되고 악용될 가능성이 있다고 합리적인 의심이 가능해지는 부분입니다.
4. 수집정보의 비교 결론
ChatGPT와 DeepSeek은 AI 기반 검색엔진이지만, 사용자 정보 수집 방식과 개인정보 보호 정책에서 큰 차이를 보인다.
- ChatGPT는 AI가 생성한 답변을 제공하며, 사용자 개인정보 보호를 강화하는 방향으로 운영된다.
- DeepSeek은 맞춤형 검색과 광고 최적화에 초점을 맞추며, 사용자 검색 기록을 적극적으로 수집한다.
개인정보 보호를 중요하게 생각하는 사용자라면 ChatGPT가 더 적합할 수 있으며, 실시간 검색과 맞춤형 검색을 원하는 사용자라면 DeepSeek이 유용할 수 있다. 속도의 측면과 현 다양한 현실 반영은 우수한 성능을 보여 주고 있는 것으로 보여 집니다. 하지만 보안에 관한 문제로는 전혀 다른 접근이 필요한 상황입니다.
DeepSeek은 사용자 데이터가 중국 내 서버에 저장되고, 정부 기관과 공유될 가능성이 있는 보안 이슈로 인해 미국, 유럽 등 서구권에서는 기업 및 정부 기관에서 사용을 제한하고 있다. 특히, 공공기관, 연구소, 금융기관 등 보안이 중요한 조직에서는 DeepSeek의 사용을 금지하는 경우가 많다. 이러한 이유로, 글로벌 기업과 정부 기관들은 보안성이 높은 검색엔진을 선호하며, AI 검색의 발전 방향을 지속적으로 검토하고 있다.
이러한 세계적인 추세에 발 맞추어 국내의 반응도 심상치가 않다.
국내의 반응은 냉정하다. 딥시크는 사용자 데이터를 과도하게 수집한다는 의혹을 받고 있다. 수집 데이터에는 입력된 텍스트, 검색 기록, 키보드 입력 패턴 등이 포함되며, 이 데이터가 중국 내 서버에 저장된다는 점이 문제로 지적되었다.
외교부, 산업통상자원부, 국방부 등 주요 부처는 딥시크 접속을 차단했다. 행정안전부는 생성형 AI 사용 시 개인정보 입력 자제를 권고하는 공문을 발송하며 주의를 당부하기도 했다. 원자력발전소를 운영하는 한국수력원자력과 한전 KPS 등 보안이 중요한 공공기관도 딥시크 사용을 금지했다.
민간기업인 카카오와 LG유플러스는 사내 업무망에서 딥시크 사용을 금지하고, 직원 개인 PC에서도 사용 자제를 권고했다. 삼성전자, SK하이닉스 등 주요 대기업은 기존부터 외부 AI 프로그램 사용을 제한해 왔으며, 포스코와 한화 등도 외부 프로그램 접속을 막고 있다.
딥시크에 대한 국내외 규제는 개인정보 보호와 국가 안보를 중심으로 강화될 가능성이 크다. 국내에서는 추가적인 조사 결과에 따라 더 강력한 제한 조치가 나올 수도 있으며, 기업과 공공기관은 자체적인 보안 정책을 더욱 강화할 것으로 보인다.
이처럼 국내외 반응이 갈리고 있는 시점에서의 deepseek사용은 좀더 주의를 기울 필요가 있다고 판단된다.
'Convergence of IT&AI~★' 카테고리의 다른 글
일본의 AI 기술 현황 (로봇, 자동화, 의료산업) (0) | 2025.02.07 |
---|---|
한국 AI 활용 현황 분석 (기업, 정부, 스타트업) (0) | 2025.02.06 |
중소기업 AI 도입 가능 서비스 평가 (고객관리, 마케팅 자동화, 재고관리) (0) | 2025.02.06 |
창작자를 위한 AI 활용법 (그림 생성, 글쓰기, 음악 작곡) (0) | 2025.02.06 |
대학생을 위한 AI 활용법 (논문 작성, 공부 보조, 코딩) (0) | 2025.02.06 |