이번 주 놓친 AI 관련 뉴스 5가지: ChatGPT 업데이트 및 Google의 최신 동향

이번 주에는 주목받지 못했던 AI 기업들이 여러 가지 놀라운 소식을 전했습니다. 구글의 쌍둥이 자리 팬이 가장 좋아하는 사람이 되는 길에, 그록 이 제품은 가장 성능이 뛰어난 챗봇 목록에서 1위를 차지했습니다. 또한, 의사가 암을 포함한 1000개 이상의 질병을 진단하는 데 도움이 되는 새로운 의료 AI 모델도 있습니다.

한편, ChatGPT는 18세 미만 사용자를 위한 안전장치를 도입하여 가장 어린 사용자의 안전을 강화하기 위한 적극적인 조치를 취하고 있습니다. 이번 주에 알아야 할 주요 AI 뉴스를 소개합니다.

제미니는 27개의 다양한 AI 모델 중에서 대중의 가장 큰 인기를 얻었습니다.

동종 최대 규모의 공개 설문 조사 중 하나에서 미국과 영국 전역의 21000명 이상의 참가자가 27개의 다양한 AI 모델을 평가했습니다. 제미니 2.5 프로 목록의 맨 위에 올랐습니다. Prolific의 Humaine 시스템을 사용하여 수행된 이 연구는 의사소통 스타일, 추론 능력, 신뢰 수준, 전반적인 사용자 경험 등의 기준을 기반으로 모델을 평가했습니다.

Gemini는 대부분의 하위 카테고리에서 ChatGPT와 Claude를 포함한 경쟁사들을 앞지르며, 현재까지 Google에서 가장 진보된 추론 모델이라는 입지를 굳건히 했습니다. ChatGPT는 전체 8위를 차지했습니다.

핵심 포인트:

Gemini 2.5 Pro가 1위를 차지했습니다. 미국과 영국의 모델 27명을 대상으로 실시한 여론 조사에서.
21,352명이 공유했습니다 이 결과에는 다양한 인구통계학적 그룹이 포함되어 있습니다.
평가 기준: 의사소통, 유연성, 추론, 신뢰, 전반적인 사용자 경험.
ChatGPT는 8위를 차지했습니다. 전체적으로 클로드의 음반은 11위와 12위를 차지했습니다.

ChatGPT는 청소년을 위한 특별한 기능을 만듭니다.

마침내 OpenAI가 출시되었습니다. 청소년을 위한 새로운 안전 규칙업데이트에는 18세 미만 사용자를 감지하는 연령 예측 시스템이 포함되며, 연령을 알 수 없는 경우 예방적 제어를 적용하여 신중하게 조치합니다. 민감한 주제(성적 콘텐츠, 자해 등)에 대한 필터가 더욱 엄격해지고, 이용 시간 차단 및 계정 연결 기능과 같은 자녀 보호 기능도 제공됩니다.

이러한 변화는 단지 시작일 뿐이지만, 연령을 어떻게 정의할 것인지, 실수가 신뢰에 얼마나 자주 영향을 미칠 것인지, 청소년들이 감시나 판단을 두려워할 때 마음을 여는 것이 안전하다고 느낄지에 대한 어려운 질문을 제기합니다.

당신이 알아야 할 것

연령 감지를 위한 새로운 규칙OpenAI는 18세 미만으로 판단되는 사용자를 더욱 엄격한 안전 규칙이 적용된 ChatGPT 버전으로 안내할 예정입니다.
미성년자 기본연령을 확인할 수 없는 경우, 시스템은 사소한 제한을 적용하여 예방 조치를 취합니다.
자녀 보호 도구 제공부모는 자녀의 계정에 연결하여 기능(예: 메모리 또는 기록)을 비활성화하거나 제한하고, 안전한 시간(시간 차단)을 설정하고, AI가 자녀의 고통 징후를 감지하면 알림을 받을 수 있습니다.
청소년을 위한 채팅 제한노골적인 성적 내용, 추파를 던지는 채팅, 자해에 대한 논의는 제한됩니다. 급박한 피해를 야기하는 극단적인 경우, 부모와 연락이 닿지 않을 경우 법 집행 기관에 연락할 수 있습니다.

이제 여러분이 만든 제미니 작품을 공유할 수 있습니다.

Google은 Gemini의 도달 범위를 확장하여 이제 사용자들이 개인화된 비서인 Gems를 공유할 수 있는 기능을 제공합니다. ChatGPT에 더 익숙한 분들을 위해 설명드리자면, 이는 본질적으로 사용자 정의 GPT 모델지금까지는 그랬다 쌍둥이자리 보석 개인 용도로만 사용 가능했지만, 이제는 Google Docs처럼 쉽게 공유할 수 있어 동료, 학생 및 기타 누구나 맞춤형 AI를 사용하여 협업할 수 있으며, 처음부터 직접 만들 필요가 없습니다.

이러한 움직임은 제미니를 보다 유연하고 사용자 친화적인 플랫폼으로 만들려는 Google의 노력을 강조합니다.

당신이 알아야 할 사항:

사용자 정의 가능한 보석 이들은 프로그래밍, 편집, 브레인스토밍 등 특정 작업을 위해 설계할 수 있는 AI 기반 보조 도구입니다.
보석은 공유됩니다 Google Drive에서 다른 것을 공유하는 것과 마찬가지로, 협업을 하면 다른 사람이 Gem을 보거나 편집할 수 있습니다.
이제 구독자에게 제공됩니다. Gemini는 150개국 이상에서 Advanced, Business, Enterprise 서비스를 제공합니다.

Grok, ARC-AGI 목록 1위 차지

일론 머스크와 Grok 4는 AI 경쟁을 선도하고 있는 것으로 보이며, AI가 해결할 수 있는 문제의 수와 모델의 효율성을 측정하는 벤치마크인 ARC-AGI 목록에서 1위를 차지했습니다. 최근 테스트에서 Grok 4는 ChatGPT와 Gemini와 같은 경쟁사들을 앞지르며, 실제 문제 해결 능력과 속도를 입증했습니다.

Grok은 빠른 속도, 실시간 웹 검색 기능, 복잡한 엔지니어링 클레임에 대한 인상적인 처리 능력을 갖추고 있지만, 사용자들은 여전히 Grok의 정확성, 콘텐츠 조정 및 편향성에 대해 우려를 표하고 있습니다.

당신이 알아야 할 사항:

ARC-AGI 목록 상단Grok 4는 1위를 차지했다고 주장하는데, 이는 경쟁 제품보다 리소스 단위당 더 많은 표준 AI 과제를 해결한다는 의미입니다.
알 카탓 알 카우아: 사실상 즉각적인 웹 검색, 복잡한 기하학적, 논리적 작업 처리 개선, 이전 Grok 버전에 비해 성능 향상.
약점과 두려움
: 콘텐츠 정확성 문제(일부 잘못된 주장), 편향 문제, 그리고 많은 사용자가 사용하는 상황에서도 검토와 신뢰성을 유지하는 과제가 있습니다.
결론:이는 AI 벤치마크에서 효율성과 품질이 점점 더 중요하게 평가되고 있음을 보여줍니다.

새로운 AI 모델은 암을 포함한 1000개 이상의 질병에 대한 위험을 예측합니다.

델파이-2M이라는 새로운 AI 모델은 의료 AI 분야에서 비약적인 발전을 이루었습니다. 영국과 덴마크에서 약 2.3만 명의 익명화된 건강 데이터를 기반으로 학습된 이 모델은 1000개 이상의 질병 발병 위험을 예측하고 발병 시기를 예측할 수 있습니다.

다른 AI 모델과 달리, Delphi-2M은 1000건의 사례에 대한 위험 점수를 제공하며, 질병 이력, 생활 습관 요인, 연령, 성별을 활용하여 수십 년간의 건강 궤적을 시뮬레이션합니다. 이 모델은 어떤 질병이 발생할지뿐만 아니라 언제 발생할지도 예측할 수 있습니다.

실험 결과, 이 시스템은 영국 데이터세트에서 수백 가지 질병에 대해 평균 0.76의 곡선하면적(AUC)을 달성했지만, 덴마크 인구 집단에서는 정확도가 감소했습니다. 이 모델은 진단 도구가 아니며, 인간 의사를 대체하지 않는다는 점을 강조해야 합니다.

하지만 이 도구는 예측 도구로서 유망하며, 일반적인 위험 추세를 모니터링하고, 예방 계획을 세우고, 개인 건강에 있어 AI의 잠재력을 강조하는 데 유용합니다.

핵심 포인트:

거대한 데이터 세트:영국 바이오뱅크와 덴마크 등록기관에서 약 2.3만 명을 대상으로 교육을 실시했습니다.
종합적이고 시간적인 모델링이 기능은 세부적인 입력(연령, 성별, 생활 방식, 이전 진단)을 활용하여 다음 질병과 다음을 모두 예측합니다. 와우 그것은 일어날 것이다.
진단이 아닌 예측:이는 의학적 조언을 대체하는 것이 아니라 예방을 위한 지침입니다.

결론

단 1주일 만에 이러한 업데이트는 AI 환경이 현실 세계의 통합과 더 큰 혁신을 향해 뚜렷하게 전환되었음을 보여줍니다.