写真の情報を認識して音声でどんな写真か説明する人工知能をFacebookが発表

読者のなかにFacebookを使って日々の近況報告や情報発信、仲間と情報交換などしている方が多いと思います。今回、そのFacebookから写真の情報を認識して音声でどんな写真か説明する人工知能機能が発表されました。

このシステムはFacebook社に勤める全盲のエンジニアによって開発されたときいています。彼自身が、友達の近況によく写真が添付されており、それが家族の写真なのか、自然の風景なのか、自分自身で知りたいと考え、大まかな情報でも人工知能で音声解説してくれるようになれば、Facebookが視覚障害者にもっと楽しくなると思い立ち、取り組んでいるそうです。

点字図書館では、従来より本のイラストなどを人が解釈し、声で説明しています。

今回のこの発表は画期的なもので、点字図書館関連でも今後導入できるかどうかについて摸索していけたらと考えるところです。こうした取り組みは各所で行われ始めており、きっと数年後にはいろんな場面(たとえば映画の音声ガイドでも)、人工知能が使われるケースが搭乗しているかもしれませんよ。

余談ですが、コンピューターの多くの技術は障害者の生活が便利になるようにと障害者自身が開発し一般的に広まったものがかなり多いです。

有名な話は顔文字ですね。顔文字は、聴覚障害者のコミュニケーション手段から生まれました。それまでは文字によるコミュニケーション手段だったのを、記号を組み合わせることにより、笑っている顔や泣いている顔・汗をかいている顔を表現したのがきっかけ。文字に感情を持たせるコミュニケーションが生まれ、メール等で使われ始めました。今となっては、顔文字から絵文字へと発展しています。一般的に広く使われています。

・写真の情報を認識して音声でどんな写真か説明する人工知能をFacebookが発表 – GIGAZINE:
http://gigazine.net/news/20151105-facebook-ai/

Facebookに写真をアップロードすると、自動的に顔を認識して該当する人物のタグ付けを提案されることがあります。これはFacebookのディープラーニングシステムによる機能の1つですが、Facebookの人工知能開発チームであるFacebook AI Research(FAIR)が、写真に含まれる物体を検出して「赤ちゃんがバスルームで歯を磨いてもらっている」など写真内の情報をText to Speechで読み上げたり、写真について質問すると回答できるなどの機能を持つ最新の人工知能を発表しました。