Meblog

このブログ記事は個人の見解であり、所属する組織の公式見解ではありません

Emoji Reading

Emoji is once again not so good for Unicode… | Sorting it all Out, v2!

leetってのは初めて聞いたけど、アルファベットを他のASCII文字で代替して書く、一種のネットスラング文化のようだ

'leet'という単語も'1337'で書き換えられる。

日本でもIDとかハンドルネームで散見するものの、やはりアルファベットの文化圏でないために、あまり広まらなかったようだ。

          • -

件の記事では、過去事例の引き合いとしてleetを出しつつ絵文字のdescriptionが不完全なために、読み上げがうまく機能しないことに言及している。

しかし、この問題はleetとは少し性質が異なると思う。leetは単なる文字の別表記にすぎないからだ。leetを解読してみれば、単一の英単語になり、文章に単射可能である。これに対し表意文字である絵文字は単一の文章に単射可能でない。このため、意味に幅がある絵文字は文脈に無視して文字情報や音声情報に変換すると、どうしても違和感がでてしまう。

この問題はleetよりも顔文字に類似していると思う。画像データか文字データか、という違いよりも
表音文字表意文字かの違いがかなり大きいように思う。

この問題を解決するには、文脈による意味の変化と、活用・品詞の変換が必要に思う。
しかし、この解決法だけでは明らかに不十分だ。

完全な解決をみるには、個人間での絵文字へ印象の差をうめなければならない。印象によって、変換の結果がことなる可能性があるからだ。
個人差とまではいかないまでも、文化間では明らかに顔文字への認識に差があるだろう。
個人的にはこれは文脈による問題よりも難しいように思う。