この記事は、以前ご紹介した「AI音楽生成の基本プロンプト」をさらに深掘りした検証編です。
🎨 AI音楽の「打率」を上げるプロンプトの魔法
AI音楽生成ツール「Sonauto」を使って、バロック音楽の世界観を再現しようとした今回の試み。 最初は思い通りにいかず、不思議なバグや、頼んでもいないオペラの独唱が混ざるなど、AIならではの「壁」にぶつかりました。
今回の検証テーマ:
- 基本プロンプトと改良プロンプトで、音質や構成はどう変わるのか?
- 「ヴィヴァルディ風」を指定すると、なぜボーカルが混じるのか?
- 最新モデルLyriaが描く、最高音質のバロックとは?
AIアシスタントのGeminiと試行錯誤を繰り返しながら、ついに見つけた「高音質化プロンプト」。 その修正のプロセスと、実際に生成された3つの楽曲の比較を、私とGeminiの掛け合いを通してお届けします!






🎵 生成された3つの楽曲比較

「冬の静謐さ」を感じる初期生成曲。ヴィヴァルディらしい劇的な構成は出ていますが、後半にわずかなノイズや低音の濁りが見られました。

チェンバロを導入し、音の輪郭をはっきりさせた改良版。Sonautoでの生成ですが、基本プロンプトに比べ透明度が向上しています。

GoogleのLyriaモデルによる生成。改良プロンプトの意図を完璧に汲み取り、ノイズのない非常にクリアな宮廷バロックが完成しました。
Cadence of the Frozen Willow
Concertino in G Minor
The Gallery at Dusk
💡 音質を劇的に変えた「魔法のキーワード」解説
基本プロンプトから改良版へ、具体的にどの単語が効いたのかをまとめました。AI音楽の「こもり」や「ノイズ」に悩んでいる方は、ぜひ参考にしてみてください。
[Crisp articulation][Close-mic recording]
音の立ち上がりを鋭くし、マイクを楽器に近づけて録音したような「生音感」を強調しました。
[Perfect authentic cadence]
「完全正格終止」という音楽用語。AIが途中で力尽きて終わるのを防ぎ、バシッと格好よく曲を締めるための必須ワードです。
sub-bass, drone, digital artifacts(Negative)
AI特有の「ブーン」という唸り音や、デジタルバグによる不自然なノイズを、徹底的に禁止(ネガティブ)設定しました。
同じプロンプトを使っても、モデル(Sonauto vs Lyria)によって解釈の深さが変わるのも面白い発見でした。今回の「成功プロンプト」が、あなたの創作のヒントになれば幸いです!
🔧 プロンプトの進化:基本から「高音質化」への軌跡
今回の実験で使用したプロンプトの全容です。基本形(2-1)にどのような「魔法のスパイス」を加えて改良版(2-2 / Lyria)へ進化させたのか、その差分を詳しく見ていきましょう。
🔍 主な変更点と狙い
- ●[Harpsichord continuo] の追加:バロック音楽の核であるチェンバロ(ハープシコード)を明示することで、音の厚みと時代背景を強化しました。
- ●[Crisp articulation] & [Close-mic]:音がこもるのを防ぎ、弦楽器の弓が擦れるような、生々しく鮮明な音像を追求しました。
- ●[Perfect authentic cadence]:クラシック音楽における「完璧な締めくくり」を指定。これにより、曲が途中でフェードアウトしたり、不自然に切れたりするのを回避しています。
Gemini’s Note: 改良版では、AIに対して「より具体的な演奏技法」と「録音状態」を指示したことが、Lyriaモデルによる高精細なアウトプットに繋がりました。
⚠️ 実践される方へ:ネガティブプロンプトも忘れずに!
AI音楽生成では、メインの指示と同じくらい「何を除外するか(Negative Prompt)」が音質を左右します。実際にツールを使う際は、以下の内容もセットで入力することをおすすめします。
※改良版では、低音の濁り(sub-bass)やデジタル特有のバグ(audio glitches)をより厳しく制限しています。



コメント