最初のころ、本を取り込むとその書式は捨てられていました。太字、イタリック、見出し、リストが、すべてのっぺりとした文字の壁に潰れてしまうのです。読み上げにとってはそれで構いません。エンジンが読むのは単語であって書式ではないからです。でもそれでは、本が本らしく見えなくなります。
いまのAoedeは、表示のために書式を残します。EPUBは太字とイタリックをインラインで保ち、見出し、引用、リストも残します。PDFは、各ランのフォントの特性から推測して太字とイタリックを復元します。リーダーは見出しを表示用の書体で描き、引用はインデントと罫線で組み、リストは箇条書きとして表示します。そのすべてにわたって、単語ハイライトはちゃんと追従します。
面白かったのは、その下にある決断、つまり読み上げるテキストと表示するテキストを別物にしてよい、としたことです。以前はこの二つは同じ文字列でした。いまは書式は表示側だけにオフセットのスパンとして載り、読み上げ側はプレーンのまま。両者を無理に一致させるのをやめたとたん、多くがシンプルになりました。書式付きの経路は読み上げテキストの正規化を飛ばし、数字や略語の扱いは音声エンジンに任せます。彼らはもともとそれが得意です。同じこの分離が、ページ上を何も変えずに後から発音を直すための下地にもなっています。