Llama 8B モデルを使用したアプリの構築

みなさん、こんにちは!最近、楽しい小さなプロジェクトの構築を終えたので、生成 AI の実験が好きな人たちとシェアできたらいいなと思いました。これは、Midjourney のプロンプトを自動生成するのに役立つプロトタイプ アプリです。細かいことを考えすぎずに創造性を刺激する簡単な方法として考えてください。

ここでは、私がこれをどのように構築したか、そしてその過程で何を発見したかを簡単に説明します。


問題: 促すのに時間がかかる

Midjourney を使い始めたとき、プロンプトの作成には時間がかかることがあることに気付きました。特に、さまざまなスタイルを試している場合はそうです。また、私の知り合いの中には (友人、同僚、疲れた日の私自身でさえ)、プロンプトの「適切な」言葉を考えるとなると行き詰まっている人がいることにも気付きました。

そこで、私は疑問に思い始めました。

  • プロンプトの生成を高速化できますか?
  • Midjourney を初めて利用する人にとって、もっと簡単に説明できますか?

これらの疑問が私のプロジェクトの基礎となりました。


建築プロセス

アプリを構築するために、私は 2 つの目標に焦点を当てました。

  1. ユーザーがアイデア(「犬」など)を簡単に入力し、すぐに役立つプロンプトを取得できるようにします。
  2. 初心者でもアプリが高速かつアクセスしやすいことを確認します。

私はさまざまな AI モデルを調査し、Llama 3.1 を 8B と 405B の両方のバージョンでテストしました。405B モデルは複雑さの点で印象的でしたが、最終的に 8B モデルを選んだのは速度のためです。数秒以内にプロンプ​​トを生成できるため、迅速な実験を目的としたツールに最適です (生成速度はサーバーの負荷によって異なる場合があります)。たとえば、アプリは次のものを生成できます。


このアイデアをすぐに実現するために、私は Gradio を使用してアプリをテストするためのシンプルなプロトタイプを作成しました。Gradio を使用すると、ユーザーがプロンプトを入力し、アスペクト比を選択して、すぐに結果を確認できる、クリーンでインタラクティブなインターフェイスを簡単に作成できます。ユーザーフレンドリーな設定により、時間を節約でき、複雑な開発ツールに煩わされることなくアプリの機能に集中できました。

アプリは次のように動作します:

  1. 「猫」や「犬」のような簡単なアイデアを入力します。
  2. アスペクト比(正方形、縦、横)を選択します。
  3. すぐに、Midjourney で使用できるプロンプトが表示されます。

2つの主な問題への対処

アプリを構築する際に、マーケティング担当者やデザイナーが頻繁に直面する 2 つの重要な問題を特定しました。

  1. 異なる比率に対する繰り返し調整: クリエイターは、それぞれ異なるアスペクト比の要件を持つ複数のプラットフォーム向けにデザインする必要があることがよくあります。たとえば、YouTube バナーは水平、IG リールは垂直、IG 投稿は正方形である必要があります。これらのパラメーターを Midjourney プロンプトに手動で追加すると、繰り返し作業になる可能性があり (アスペクト比パラメーターを追加するのを忘れやすい場合もあります)、プロセスに時間がかかります。
  2. 即座のアイデアの欠如: クリエイターは、創作プロセスを開始するためのアイデアが不足していることに悩むことがあります。彼らには、インスピレーションや、考えすぎずに効果的なプロンプトを効率よく生成する方法が必要です。そこで、このプロセスを処理して創造性を高めるための自動化アプリのアイデアが生まれました。

これらの課題に対処するために、私たちはオープンソース モデルに基づいてこのアプリを構築し、さまざまなユース ケースでアクセスしやすく、柔軟に対応できるようにしました。


テストとフィードバック

プロトタイプを作成した後、デザイナー、マーケティング担当者、さらには Midjourney の経験がない数人の友人と共有しました。そこで学んだことは次のとおりです。

  • デザイナーとマーケティング担当者向け: 彼らは、アプリによってワークフローが促進され、生産性が約 50%。プロンプトをすばやく生成できるため、より多くのスタイルを試し、ビジュアルをより速く改良できるようになりました。
  • 初心者向け: Midjourney を初めて使用した人でも簡単に使用できました。「犬」などの単語を 1 つ入力するだけで、すぐに機能するプロンプトが表示されます。あるユーザーは、「AI ツールを自信を持って使用できるとは思っていませんでした。とても使いやすいです!」と述べています。


これを作ることで学んだこと

  • 適切なモデルを選択することが重要です: AI を搭載したアプリを構築する場合、規模が大きいほど良いとは限りません。重要なのは、ユーザーのニーズを正確に満たし、期待される結果を効率的に提供するモデルを選択することです。このプロジェクトでは、8B モデルがパフォーマンスと速度の完璧なバランスを実現しました。
  • シンプルさが鍵: 人々は、わかりやすく、選択肢が多すぎて圧倒されないツールを高く評価します。
  • AI を使って構築するのは楽しい: このプロジェクトは、私がなぜ生成 AI に取り組むのが好きなのかを思い出させてくれました。それは、創造性を身近で楽しいものにすることなのです。


結論

このプロジェクトは、生成型 AI が何を提供できるかを探る上で、小さいながらも意義深い一歩でした。このようなツールを構築することで、テクノロジーへの情熱と創造性を組み合わせることができ、AI がワークフローを簡素化し、他の人に新しい可能性をもたらす様子を見るのは非常にやりがいのあることです。この体験を共有したのは、アプリを紹介するためだけではなく、AI に対する同じ好奇心と興奮を共有する他の人たちとつながるためでした。

楽しい構築と実験を!

ブログに戻る