使用 Llama 8B 模型建立應用程式

嘿大家!我們最近完成了一個有趣的小項目,我認為與其他喜歡嘗試生成式人工智慧的人分享它會很棒。它是一個原型應用程序,可以幫助您自動產生 Midjourney 提示。可以將其視為激發創造力的簡單方法,無需過多考慮細節。

以下是我如何建造它以及在此過程中我發現的內容的簡要概述!


問題:提示需要時間

當我第一次開始使用 Midjourney 時,我意識到創建提示有時可能會很耗時 — — 特別是在嘗試不同的風格時。我還注意到,我認識的一些人(朋友、同事,甚至是疲憊一天時的自己)在想出「正確」的提示詞時會感到困惑。

因此,我開始思考:

  • 我可以讓提示產生得更快一些嗎?
  • 我可以讓剛接觸 Midjourney 的人更容易嗎?

這些問題成為我的專案的基礎。


建造過程

為了建立該應用程序,我專注於兩個目標:

  1. 讓使用者可以輕鬆輸入一個想法(例如“狗”)並快速獲得有用的提示。
  2. 確保應用程式快速且易於訪問,即使對於初學者也是如此。

我探索了不同的 AI 模型,測試了 8B 和 405B 版本的 Llama 3.1。雖然 405B 模型在複雜性方面令人印象深刻,但我最終選​​擇了 8B 模型,因為它的速度很快。它可以在幾秒鐘內生成提示,使其成為完美的快速實驗工具(生成速度可能因伺服器負載而異)。例如,該應用程式可以產生:


為了快速將這個想法變為現實,我使用 Gradio 建立了一個簡單的原型來測試該應用程式。 Gradio 可以輕鬆建立一個乾淨的互動式介面,使用者可以在其中輸入提示、選擇縱橫比並立即查看結果。其用戶友好的設定節省了我的時間,讓我能夠專注於應用程式的功能,而不是陷入複雜的開發工具。

該應用程式的工作原理如下:

  1. 您輸入一個簡單的想法,例如“貓”或“狗”。
  2. 選擇縱橫比:正方形、垂直或水平。
  3. 您將立即獲得可在 Midjourney 中使用的提示!

解決兩個主要問題

在建立應用程式時,我們發現了行銷人員和設計師經常面臨的兩個關鍵問題:

  1. 針對不同比例進行重複調整: 創作者通常需要為多個平台進行設計,每個平台都有不同的寬高比要求。例如,YouTube 橫幅應該是水平的,IG 捲軸應該是垂直的,而 IG 貼文應該是方形的。手動將這些參數新增至 Midjourney 提示可能會重複(有時很容易忘記新增縱橫比參數),使該過程非常耗時。
  2. 缺乏及時的想法: 有時,創作者會因為缺乏創意而難以啟動他們的創作過程。他們需要靈感或一種無需過度思考就能簡化產生有效提示的方法。這就是自動化應用程式的想法的誕生——來處理這個過程並提供創造力的推動力。

為了應對這些挑戰,我們基於開源模型建立了此應用程序,使其可存取且靈活適用於各種用例。


測試和回饋

建立原型後,我與一些朋友分享了它——設計師、行銷人員,甚至一些沒有 Midjourney 經驗的人。以下是我所了解的情況:

  • 對於設計師和行銷人員: 他們發現這款應用程式提高了他們的工作流程,產出量增加了約 50%。快速產生提示的能力意味著他們可以嘗試更多風格並更快地改進視覺效果。
  • 對於新手: 即使那些沒有使用過 Midjourney 的人也會發現它很容易使用。他們可以輸入一個單詞,例如“狗”,然後立即得到有效的提示。一位用戶表示:“我從來沒有想過我會自信地使用人工智慧工具——這讓我覺得它如此平易近人!”


這棟建築教會了我什麼

  • 選擇正確的模型很重要: 在使用 AI 建立應用程式時,規模越大並不一定越好。關鍵是選擇一個能夠準確滿足使用者需求並有效提供預期結果的模型。對於這個項目,8B 型號在性能和速度之間實現了完美的平衡。
  • 簡單是關鍵: 人們欣賞簡單易用且不會有太多選項的工具。
  • 建構人工智慧很有趣: 這個項目讓我想起了為什麼我喜歡使用生成式人工智慧——它是為了讓創造力變得觸手可及且充滿樂趣。


結論

該專案是探索生成式人工智慧所能提供的功能的一個小而有意義的一步。建構這樣的工具讓我能夠將我對科技的熱情與創造力結合起來,看到人工智慧如何簡化工作流程並為其他人開啟新的可能性,這是非常有意義的。我希望分享這種體驗,不僅是為了展示該應用程序,也是為了與其他對人工智慧有著同樣好奇和興奮的人建立聯繫。

快樂的搭建和實驗!

返回網誌