Kristopher Baker iOSを土台に · プロダクトシステム · AI支援ワークフロー
← Aoede

shipped · 2026.06.07 · 約2分

最初から最後まで、読み上げが動く

Aoedeに最初にほしかったのは、薄くてもいいから一連のループが動くことでした。プレーンテキストのファイルを開き、自然な声で読み上げ、発話に合わせて単語が一つずつ灯り、どこで止めたかを覚えていて、次に開いたときその場所に戻る。そのひと続きが、いまエンドツーエンドで動いています。

そこに至るには、早い段階で一つの決断をして、その周りに全部を組み立てる必要がありました。音声バックエンドはどれもタイミングの報告のしかたが違います。Appleのシステム音声は単語ごとのコールバックをリアルタイムで返してくれますが、ニューラルモデルは何も返さないので自分で導き出すしかありません。その厄介さをリーダーに漏らさないために、すべてを一つのハイライトタイムラインに正規化し、リーダーはその一つだけを見て、出どころは気にしません。この境界があるから、あとでより良い声を足すのも、書き直しではなく新しいバックエンドを追加するだけで済みます。

これは、Aoedeが部品の寄せ集めであることをやめ、製品らしく感じられ始めたマイルストーンでした。