Google은 YouTube, 지도 및 검색에 Flash Thinking을 연결하는 Gemini 2.0 Pro 및 Flash-Lite를 출시합니다.

Google의 대규모 언어 모델(LLM)인 Gemini 시리즈는 약 2.0년 전에 잘못 생성된 몇몇 당혹스러운 이미지로 인해 험난한 출발을 했지만 그 이후로 꾸준히 개선되었으며, 회사는 XNUMX세대 제품인 Gemini XNUMX을 소비자와 기업을 위한 역대 최대 규모이자 최고의 제품으로 만들려는 의지를 보이는 듯합니다.

오늘, 발표 이 회사는 Gemini 2.0 Flash의 공식 출시를 발표하고, Gemini 2.0 Flash-Lite를 출시했으며, Gemini 2.0 Pro의 베타 버전을 출시했습니다.

개발자와 기업을 지원하도록 설계된 이 모델은 현재 Google AI Studio와 Vertex AI를 통해 사용할 수 있으며, Flash-Lite는 공개 미리 보기로 제공되고 Pro는 조기 테스트로 제공됩니다.

Google DeepMind의 CTO인 Koray Cavukcioglu는 회사 블로그 게시물에서 "이러한 모든 모델은 출시 시 텍스트 출력이 포함된 멀티미디어 입력 기능을 갖추고 있으며, Plus 미디어는 향후 몇 달 안에 일반 사용에 제공될 예정입니다."라고 발표를 알리며 이렇게 썼습니다. 이는 Google이 경쟁사들과 달리 이점을 제공한다는 것을 보여줍니다. DeepSeek 그리고 OpenAI 강력한 경쟁자를 출시합니다.

Google은 멀티미디어 기능을 활용합니다

DeepSeek-R1도 아니고 OpenAI의 새로운 o3-mini 모델 멀티미디어 입력(예: 이미지, 파일 업로드 또는 첨부 파일)을 허용합니다.

R1 모델은 웹사이트와 모바일 채팅 앱에서 이러한 기능을 사용할 수 있지만, 60년 이상 된 기술인 광학 문자 인식(OCR)을 사용하여 이러한 업로드에서 텍스트만 추출하며, 다른 기능은 이해하거나 분석하지 않습니다.

하지만 두 모델 모두 의도적으로 답을 생각하고 "사고의 사슬"과 응답의 타당성을 검토하는 데 더 오랜 시간을 소요하는 새로운 유형의 "추론" 모델을 나타냅니다. 이는 Gemini 2.0 pro 시리즈와 같은 일반적인 대규모 언어 모델과는 대조적입니다. 따라서 Gemini 2.0, DeepSeek-R1, OpenAI o3를 비교하는 것은 사과와 오렌지를 비교하는 것과 같습니다.

하지만 오늘 Google에서도 사고 측면에서 몇 가지 소식이 있었습니다. Google CEO Sundar Pichai가 다음을 통해 발표했습니다. X 플랫폼 앱 업데이트에 관하여 구글 제미니 iOS 및 Android 모바일 기기에서는 Gemini 2.0 Flash Thinking 모델을 사용할 수 있습니다. 이 모델은 Google Maps, YouTube, Google 검색과 연동되어 DeepSeek이나 OpenAI와 같은 새로운 경쟁 업체들이 이러한 서비스 없이는 따라올 수 없는 완전히 새로운 AI 기반 검색 및 상호작용을 구현할 수 있습니다.

이 글을 쓰는 동안 iPhone에서 Google Gemini iOS 앱을 잠깐 사용해 봤는데, 처음에 궁금했던 점을 바탕으로 인상적이었습니다. 지난달 가장 많이 시청된 YouTube 동영상 상위 10개에서 유사점을 찾아주고, 인근 병원 목록과 영업/폐점 시간을 단 몇 초 만에 알려주었습니다.

Gemini 2.0 플래시 공개 릴리스

베타 버전으로 처음 출시된 Gemini 2.0 Flash 모델은 12월에, 현재 생산 준비가 되었습니다.

고효율 AI 애플리케이션을 위해 설계되었으며, 저지연 응답을 제공하고 대규모 다중 모드 추론을 지원합니다.

경쟁 제품에 비해 이 솔루션이 갖는 주요 장점 중 하나는 컨텍스트 창, 즉 사용자가 인센티브로 추가할 수 있는 토큰 수와 LLM 기반 챗봇이나 API와의 단일 상호 작용을 통해 받을 수 있는 토큰 수입니다.

지난주에 공개된 OpenAI의 새로운 o3-mini와 같은 많은 주요 모델이 200000만 개 이하의 토큰(400~500페이지 분량의 소설에 해당)을 지원하는 반면, Gemini 2.0 Flash는 XNUMX만 개의 토큰을 지원하여 엄청난 양의 정보를 처리할 수 있어 특히 빈도가 높고 대규모 작업에 유용합니다.

Gemini 2.0 Flash-Lite: 저렴한 AI 솔루션

Gemini 2.0 Flash-Lite는 품질 저하 없이 비용 효율적인 AI 솔루션을 제공하는 것을 목표로 하는 완전히 새로운 대규모 언어 모델입니다.

Google DeepMind에 따르면 Flash-Lite는 동일한 가격과 속도를 유지하면서 MMLU Pro(1.5% 대 77.6%) 및 Bird SQL(67.3% 대 57.4%)과 같은 외부 벤치마크에서 전체 크기(더 많은 매개변수화)의 이전 버전인 Gemini 45.6 Flash보다 성능이 더 우수하다고 합니다.

또한 멀티미디어 입력을 지원하고 전체 Flash 모델과 유사하게 100만 개의 토큰으로 구성된 컨텍스트 창을 제공합니다.

Flash-Lite는 현재 Google AI Studio와 Vertex AI를 통해 공개 미리보기로 제공되고 있으며, 앞으로 몇 주 안에 일반에 공개될 예정입니다.

아래 표에서 볼 수 있듯이, Gemini 2.0 Flash-Lite의 가격은 토큰 백만 개당 0.075달러(입력) 및 토큰 백만 개당 0.30달러(출력)입니다. Flash-Lite는 개발자에게 매우 저렴한 옵션으로, 대부분의 벤치마크에서 Gemini 1.5 Flash보다 우수한 성능을 제공하면서도 동일한 비용 구조를 유지합니다.

Logan Kilpatrick은 Gemini 2.0 Flash 모델의 비용과 가치를 강조했습니다. X 플랫폼의 남성"Gemini 2.0 Flash는 모든 LLM 모델 중에서 가장 가성비가 좋습니다. 지금이 바로 구매할 때입니다!"

실제로 공급자 API를 통해 제공되는 기타 선도적인 기존 LLM 모델과 비교했을 때, OpenAI 4-미니 ($0.15/$0.6/백만 I/O 토큰당) 및 인류학적 클로드 ($0.8/$4! 3만 I/O 토큰당) 및 DeepSeek의 기존 LLM V0.14($0.28/$2.0)보다도 Gemini XNUMX Flash가 가격 대비 가장 가치 있는 것으로 보입니다.

Gemini 2.0 Pro 베타가 컨텍스트 창에 2만 개의 아이콘을 추가했습니다.

Gemini 2.0 Pro(베타) 모델은 이제 더욱 고급 AI 기능이 필요한 사용자를 위해 테스트용으로 제공되고 있습니다.

Google DeepMind는 이 모델을 프로그래밍 성능과 복잡한 쿼리 처리 능력 측면에서 가장 강력한 모델이라고 설명합니다. 2만 자까지 입력 가능한 컨텍스트 창, 향상된 추론 기능, 그리고 Google 검색 및 코드 실행과 같은 외부 도구와의 통합 기능을 갖추고 있습니다.

Google의 외부 머신 러닝 개발 전문가이자 VentureBeat와 자주 협업하는 Red Dragon AI의 공동 창립자 겸 CEO인 Sam Witteveen은 다음과 같이 논의했습니다. 유튜브 리뷰 속 프로 모델"새로운 Gemini 2.0 Pro 모델은 1.5만 개의 아이콘이 있는 컨텍스트 창을 갖추고 있으며, 위젯, 코드 실행, 함수 호출, Google 검색과의 통합을 지원합니다. Pro XNUMX에 포함되었던 모든 기능이 개선되었습니다."

그는 또한 구글의 AI 개발에 대한 반복적 접근 방식을 지적했다. "구글 전략의 주요 차이점 중 하나는 일반적으로 사용 가능(GA)되기 전에 모델의 베타 버전을 출시하여 피드백을 기반으로 빠른 반복이 가능하다는 것입니다."

성능 벤치마크는 Gemini 2.0 제품군 모델의 성능을 더욱 입증합니다. 예를 들어, Gemini 2.0 Pro는 추론, 다국어 이해, 장문 처리 등의 작업에서 Flash와 Flash-Lite보다 우수한 성능을 보입니다.

AI 안전 및 미래 개발

이러한 업데이트와 함께, 구글 딥마인드는 제미니 2.0 모델에 대한 새로운 안전 및 보안 조치를 구현하고 있습니다. 강화 학습 기법을 활용하여 응답 정확도를 높이고, 인공지능을 활용하여 결과를 분석하고 개선하고 있습니다. 또한, 자동화된 보안 테스트를 통해 간접 클레임 주입 위협을 포함한 취약점을 식별하고 있습니다.

앞으로 Google DeepMind는 Gemini 2.0 모델 제품군의 기능을 확장할 계획이며, 텍스트 이외의 추가 방법이 향후 몇 달 안에 일반적으로 제공될 것으로 예상됩니다.

이러한 업데이트를 통해 Google은 AI 개발에 대한 노력을 강화하고 효율성, 경제성, 고급 문제 해결을 위해 설계된 모델 세트를 도입하여 DeepSeek의 성장에 대응하고 있습니다. 강력한 모델부터 매우 강력하면서도 매우 저렴한 모델, 약간 저렴한 모델(하지만 여전히 저렴한 모델)까지 다양합니다.

이것이 구글이 이전에는 OpenAI가, 현재는 DeepSeek가 장악하고 있는 엔터프라이즈 AI 시장에 진출하는 데 도움이 될까요? 계속해서 소식을 전해드리겠습니다!

상사에게 좋은 인상을 남기고 싶다면 VB Daily가 도와드리겠습니다. 조직 혁신부터 실제 적용까지, 기업들이 생성적 AI를 어떻게 활용하고 있는지에 대한 최신 정보를 제공하여 ROI를 극대화할 수 있는 인사이트를 공유하실 수 있습니다.