Google發表最新AI模型Gemini！股價上漲5.3％　示範影片驚艷

2023/12/08 17:41:24文／資深記者李錦奇

Google昨天發表最新AI基礎模型Gemini，強調是目前自家最強大、最通用的AI 模型，將導入 Bard 和 Pixel 8 Pro，為使用者帶來最大升級的 AI 體驗和進階功能。外界解讀，Google迎戰微軟Copilot、OpenAI的ChatGPT等各大廠牌的意味濃厚。外資分析師也給予肯定，認為這代表了谷歌的重大創新，股價收盤上漲5.3％。

從Google釋出的示範影片可見，Gemini可以一邊觀察人類的動作，做即時的回應，像是看出用戶所放至的物品或畫圖案的顏色（如下圖，翻攝Google/Youtube）。

當用戶畫出吉他（如下圖），也是一眼看出，然後隨著用戶又畫出擴音器，猜出變成電吉他，隨即搭配播放音樂（如下圖，翻攝Google/Youtube）。

甚至，連猜手勢、硬幣藏哪裡，或是用國語唸出鴨子（如下圖），都難不倒Gemini，強大功能讓人印象深刻。

根據《CNBC》報導，Google高層表示，Gemini 的效能優於 OpenAI 的 GPT-3.5，但並未透露與 OpenAI 最新模型 GPT-4 的比較情況；美國銀行分析師認為，Google擁有強大的人工智慧能力，數據表明擁有一流的專有人工智慧能力，這可能對 2024年上半年的股價產生積極影響。”

微軟最近推出了 Copilot，由 OpenAI 的 ChatGPT 提供支持，嵌入在 Word、Excel 和其他 Office 程式中，每人每月費用為 30 美元。Piper Sandler 分析師 10 月曾表示，到 2026 年，Copilot 可為微軟帶來超過 100 億美元的年收入。

Google 暨 Alphabet 執行長 Sundar Pichai撰文指出，Gemini 是 Google 至今推出最有彈性的AI模型，共有Ultra、Pro和Nano三種大小，在無論是資料中心或行動裝置上都能高效運行。 Google眾多產品中將整合Gemini，並相信可以為開發人員和企業客戶在用AI構建和拓展業務時帶來極大幫助。

Gemini 1.0 版本的模型推出三種不同的規模：

•   Gemini Ultra：規模最大、功能最強大的模型，專為高度複雜的任務而設計。
•   Gemini Pro：最適合擴展、橫跨各種類型的任務。
•   Gemini Nano：處理裝置上的任務最有效率的模型，可在Pixel 8 Pro 上運行。

Gemini 1.0 所受的訓練，是同時識別和理解文字、圖像和音訊等資訊，所以能進一步的理解更細微的資訊，並回答涉及複雜主題的問題。這也讓 Gemini 在解釋、推理像是數學和物理這樣複雜的問題上，表現特別出色。

Google強調，為了診斷模型的內容安全性，並確保輸出的內容符合 Google 的政策，在Gemini 的各個訓練階段使用了不同的基準測試，包括真實有害指令提示（Real Toxicity Prompts），是由 Allen Institute of AI 的專家開發，從網路上集合了有害程度不一的10萬個指令提示。

為限制 AI 造成的危害，Google打造專用的安全分類機制，可用來辨識、標籤及篩選內容，像是有關暴力或是負面刻板印象的內容。另外，搭配健全的篩選機制，透過這種分層處理的方式，確保 Gemini 對每個人來說都更具安全性與包容性。

即日起，Bard將使用專門調整的 Gemini Pro 模型，帶來更進階的邏輯推理、規劃與理解等能力。這將是Bard自推出以來，最大幅度的升級更新。

採用Gemini Pro模型的Bard將先以英文版本在超過170多個國家和地區提供使用，Google預計不久後開放其他模態應用，並持續拓展對於不同語言與地區的支援。

另外，也將把Gemini帶到Pixel裝置上。Pixel 8 Pro是第一款能夠運行Gemini Nano的智慧型手機，並透過Gemini 支援全新功能，像是在錄音工具中提供摘要服務，以及Gboard中的智慧回覆。其中，Gboard智慧回覆將可以率先在WhatsApp使用，並將在明年持續拓展至更多即時通訊應用程式。

接下來幾個月，Gemini將整合至Google的更多核心產品與服務中，包括 Google搜尋、廣告、Chrome瀏覽器以及Duet AI。

Google也開始嘗試在Google搜尋裡測試使用Gemini，可以讓生成式搜尋體驗（Search Generative Experience）的速度更快，在美國英文介面上的延遲會降低 40％，品質也會提高。