Google發表最新AI模型Gemini!股價上漲5.3% 示範影片驚艷
2023/12/08 17:41:24文/資深記者 李錦奇Google昨天發表最新AI基礎模型Gemini,強調是目前自家最強大、最通用的AI 模型,將導入 Bard 和 Pixel 8 Pro,為使用者帶來最大升級的 AI 體驗和進階功能。外界解讀,Google迎戰微軟Copilot、OpenAI的ChatGPT等各大廠牌的意味濃厚。外資分析師也給予肯定,認為這代表了谷歌的重大創新,股價收盤上漲5.3%。
從Google釋出的示範影片可見,Gemini可以一邊觀察人類的動作,做即時的回應,像是看出用戶所放至的物品或畫圖案的顏色(如下圖,翻攝Google/Youtube)。
當用戶畫出吉他(如下圖),也是一眼看出,然後隨著用戶又畫出擴音器,猜出變成電吉他,隨即搭配播放音樂(如下圖,翻攝Google/Youtube)。
甚至,連猜手勢、硬幣藏哪裡,或是用國語唸出鴨子(如下圖),都難不倒Gemini,強大功能讓人印象深刻。
根據《CNBC》報導,Google高層表示,Gemini 的效能優於 OpenAI 的 GPT-3.5,但並未透露與 OpenAI 最新模型 GPT-4 的比較情況;美國銀行分析師認為,Google擁有強大的人工智慧能力,數據表明擁有一流的專有人工智慧能力,這可能對 2024年上半年的股價產生積極影響。”
微軟最近推出了 Copilot,由 OpenAI 的 ChatGPT 提供支持,嵌入在 Word、Excel 和其他 Office 程式中,每人每月費用為 30 美元。Piper Sandler 分析師 10 月曾表示,到 2026 年,Copilot 可為微軟帶來超過 100 億美元的年收入。
Google 暨 Alphabet 執行長 Sundar Pichai撰文指出,Gemini 是 Google 至今推出最有彈性的AI模型,共有Ultra、Pro和Nano三種大小,在無論是資料中心或行動裝置上都能高效運行。 Google眾多產品中將整合Gemini,並相信 可以為開發人員和企業客戶在用AI構建和拓展業務時帶來極大幫助。
Gemini 1.0 版本的模型推出三種不同的規模:
• Gemini Ultra:規模最大、功能最強大的模型,專為高度複雜的任務而設計。
• Gemini Pro:最適合擴展、橫跨各種類型的任務。
• Gemini Nano:處理裝置上的任務最有效率的模型,可在Pixel 8 Pro 上運行。
Gemini 1.0 所受的訓練,是同時識別和理解文字、圖像和音訊等資訊,所以能進一步的理解更細微的資訊,並回答涉及複雜主題的問題。這也讓 Gemini 在解釋、推理像是數學和物理這樣複雜的問題上,表現特別出色。
Google強調,為了診斷模型的內容安全性,並確保輸出的內容符合 Google 的政策,在Gemini 的各個訓練階段使用了不同的基準測試,包括真實有害指令提示(Real Toxicity Prompts),是由 Allen Institute of AI 的專家開發,從網路上集合了有害程度不一的10萬個指令提示。
為限制 AI 造成的危害,Google打造專用的安全分類機制,可用來辨識、標籤及篩選內容,像是有關暴力或是負面刻板印象的內容。另外,搭配健全的篩選機制,透過這種分層處理的方式,確保 Gemini 對每個人來說都更具安全性與包容性。
即日起,Bard將使用專門調整的 Gemini Pro 模型,帶來更進階的邏輯推理、規劃與理解等能力。這將是Bard自推出以來,最大幅度的升級更新。
採用Gemini Pro模型的Bard將先以英文版本在超過170多個國家和地區提供使用,Google預計不久後開放其他模態應用,並持續拓展對於不同語言與地區的支援。
另外,也將把Gemini帶到Pixel裝置上。Pixel 8 Pro是第一款能夠運行Gemini Nano的智慧型手機,並透過Gemini 支援全新功能,像是在錄音工具中提供摘要服務,以及Gboard中的智慧回覆。其中,Gboard智慧回覆將可以率先在WhatsApp使用,並將在明年持續拓展至更多即時通訊應用程式。
接下來幾個月,Gemini將整合至Google的更多核心產品與服務中,包括 Google搜尋、廣告、Chrome瀏覽器以及Duet AI。
Google也開始嘗試在Google搜尋裡測試使用Gemini,可以讓生成式搜尋體驗(Search Generative Experience)的速度更快,在美國英文介面上的延遲會降低 40%,品質也會提高。