Llama 90B MultiModal 讓烹飪靈感變得簡單
分享
1. 探索步驟:與利害關係人接觸並定義問題
決定做什麼菜有時候感覺像是永無止境的難題——尤其是當你打開冰箱卻只看到一堆隨機的食材時。在與朋友、家人和其他烹飪愛好者聊天后,我們注意到一個反覆出現的主題:人們常常缺乏靈感或對同樣的老食譜感到厭倦。
生成式人工智慧可以增加價值嗎?
我們想,“如果人工智慧可以拍下冰箱裡的東西並當場提出膳食建議,那會怎樣?”這將:
- 節省時間:不再無止盡地爭論做什麼菜。
- 增加多樣性:推出用戶可能自己都想不到的有趣的新菜餚。
- 激發創造力:為那些「心情不太好」的日子提供新鮮、出乎意料的菜單創意。
我們的目標只是探索是否可以製作一個輕鬆、好奇心驅動的應用程式來激發廚房的創造力。
2. 設計步驟:解決方案與 Gradio UI 原型
為什麼選擇 Llama 3.2 90B (多模)?
我們使用了 Llama 3.2 90B,這是一個能夠處理文字和圖像的多模式模型。該模型的大量參數和圖像識別能力對於識別冰箱物品和提出食譜至關重要。
建構 Gradio 介面
我們把事情弄得非常簡單:
- 上傳照片:使用者拍攝冰箱或食品儲藏室物品的照片並上傳。
- 自動辨識:人工智慧分析影像以偵測常見成分。
- 菜單建議:幾秒鐘內,用戶就可以看到根據識別出的菜餚量身定制的膳食建議。
透過利用 Gradio,我們獲得了一個乾淨、用戶友好的介面,並快速運行,讓測試人員上傳照片、查看即時結果並分享即時回饋。
3.實施步驟:整合使用者回饋
我們邀請了一小群家庭廚師和業餘廚師在幾天內嘗試了原型。以下是我們所了解的情況:
- 食物辨識準確度:人工智慧正確識別了大約 80% 的成分。錯誤時有發生-例如,當食物側放在袋子裡時,把檸檬誤認為獼猴桃,或把鮭魚誤認為胡蘿蔔。
- 菜單建議的相關性:約65%的測試者表示模型的食譜符合他們真實的烹飪習慣。他們發現它確實很有幫助。
- 趣味因素與靈感:其餘 35% 的人喜歡創造力,但表示只有在沒有烹飪靈感或想要一些好玩的東西時才會完全依賴它。
我們透過添加更清晰的成分標籤和簡單的介面提示來改進了原型,要求使用者在生成餐點之前確認或編輯任何錯誤識別的物品。
4. 評估步驟:衡量產品影響
提升時間和創造力
測試人員認為,有了人工智慧快速產生的想法,他們就擺脫了常見的「做什麼菜」的難題。有了應用程式處理頭腦風暴,他們可以花更多時間實際烹飪,或者只是放鬆並享受這個過程。
用戶採用和後續步驟
- 採用驅動因素:當用戶在日常生活中遇到靈感匱乏或尋求一點樂趣時,他們更有可能使用該應用程式。
- 改進空間:增強模型的準確性,以處理更細微或更模糊的成分,使其更加可靠。
- 潛在功能:未來的增強功能可能包括飲食偏好過濾器(純素食、無麩質等)和推薦食譜的內建審查系統。
結論
我們的「滿足好奇心」計畫證明,像 Llama 3.2 90B 這樣的多模態 AI 模型可以為「晚餐吃什麼?」的日常困境提供有趣而實用的解決方案。透過以合理的準確度識別冰箱中的物品並提供富有創意的菜單想法,這個輕鬆的應用程式鼓勵用戶探索新鮮和意想不到的飯菜——無需烹飪常規。