追伸:
気象予報士の森田正光さんというひとらしいです。すごく有名な方なんですね。それすら知らなかった。
でも美しいものは、やっぱり美しい。言葉でも、ひとでも。
(……前回のあらすじ)
キャプチャが有効とみなされているのは、つまるところ、画像をキーとした検索の困難さを示すものではないのかという自分なりの結論がありましたが、それならちょっとやってみようということで今回。
---------------------
「キーワード検索」なら、うろ覚えでも、ひと文字ふた文字まちがっていても、グーグル様は、「それは○○のことかしらね……」という具合に、やさしく適所へと導いてくれました。
ところが、こと「キーイメージ検索」を選んだとたん、担当さんも、その物腰も、手のひらを反した感じで、こちらがいっしょうけんめい絵を描いて尋ねても、まことに当を得ぬ返事ばかりを返します。
ああこれのことね、と並べられたのは、訳のわからぬ文字列の画像ばかりでした。少なくとも、
「絵A」→「絵B」
はぜんぜんあかんみたいです。やっぱり、
「絵A」→「文字A」→(「文字A」+「絵B」)→「絵B」
という流れなんでしょうか。
絵がへただ、とお笑いくださるな。そもそも絵のイメージなど、こんなもんです。わたしの中の「柔らかい時計」の印象はこんなふうでございました。
これには、グー様の方でも、だいぶ弱ったみたいで、オレンジ色のロゴやら、それこそキャプチャー画像まで並べて返してきましたが、あの「柔らかい……」との関連は、いっさい認めてくれません。もっとも、相手が人間であっても、同じような結果だったかもしれませんが。
そこで、本物の(写真の)絵をチラチラ見ながら描いたのが次の絵です。
もうね、堂々としたものです。これでわからんという人は、教養のない人です。誰に見てもらっても、あああの絵ね、とわかっていただけます。模写じゃなくて、あくまで絵の印象なのですから。記憶の中の言葉(あいまいでしょ?)と同じです。
この大作をキーイメージにして、意気揚々と、わたしはグーグルに託したものです。
グー様ならきっとわかってくださる。だって記憶じゃなくて、見ながら描いた絵ですもの、ふふん。
その結果は、冒頭に述べたとおりです。
グー様のアルゴリズムがくそなのか、わたしの絵がくそなのか。
グー様に、「柔らかい時計」と認められたい。
次回の挑戦に、胸がときめく。
6月の土曜、ようやくの梅雨空。
くやしい。
---------------------
わたしは芸能人さんの顔と名前が一致しないので、しょっちゅうグーグルの画像検索で確かめたりしています。
そのさい、キーとなるのは、言葉であって画像ではありません。そして、検索結果として出てくる画像も、あらかじめ言葉とのセットでグーグルのデータベースにしまわれていたものが引っ張り出されているみたいです。
つまり、
(1)キーワード(たとえば芸能人の氏名)を投入
↓
(2)画像とセットになっている言葉(同氏名)でヒット
↓
(3)その画像が返される
というような流れであろうと思います。
しかしですね、世に「キーワード」はあっても、いまだ「キーイメージ」という言葉はあまり聞くことはありません。
いったい、画像をキーにしての検索はできないものでしょうか。
できるんですね。
グーグルの「画像を検索」の中に、
「画像で検索 テキストの代わりに画像で Google を検索します」
という機能があって、ウェブ上の、あるいはその場でアップロードした画像をもとに検索することができるようです。
たとえば、下の画像を、グーグルの「画像で検索」をしてみます。左にあるやつですね。
すると、「ときはぎ……」とか、「とある……」とか、たしかに「と」の文字で始まる画像を検出してくれます。あとは赤いフレームのめがねとか、赤いリボンとか、極局所的な色の変化を読み取って判定しているみたいです。最初のひと文字しか読んでいないのが笑えますが、これは画像⇔画像で直接に比較するのではなく、文字を介在させていると予感させるものです。この場合の文字とは、「と」です。すなわち、赤いめがねも赤いリボンも「と」なんでしょう。
ところが、続けて次の画像でやってみると、意外な結果が返ってきます。
これはさきほどの画像の「と」の部分だけを少し変形したものです。誰が読んでも「と」から始まる画像だとわかるでしょうと思いきや、グーグル様は「こ」と解釈されたようで、「こもれび……」とか、あるいは「びゃ」とか文字の画像を寄越してきました。
わたしは、腕を組んで感心していました。
なるほど。それで世に CAPTCHA(キャプチャ/画像認証)なるものが、効果があるとされているのか。
キャプチャとは、よく他人のブログなどに書き込む前などに出てくるやつで、デフォルメした英文字の画像を見せ、それをアルファベットとして正しく認識できた者だけを人間(ボットではない)であるとみなして先に進むことを許可するという、一種のチューリングテスト(投稿者が判定を受ける)みたいなものですね。
たとえば下のような画像を見せられても、人間と違って、ボット(ソフトウェア)には、#1も#2も、「A」とは読めないということが、キャプチャの信頼性の基礎となっているんですね。
それを思うと、ひとつの結論がにじみ出るのです。
画像をキーとする限り、まともな検索はできないのではないか(偶然はともかく)。
「あの形のあの木と時計の絵、何だったかな」と、思うままに絵を描いてみるのでは、よほど的確でない限り、とうていキーとして成立しないでしょう。
「記憶の固執」「柔らかい時計」「ダリ」などという言葉が絶対に必要です。
(続く……ことになりました)
〒510-0307 三重県津市河芸町影重861-1
TEL : 090-1755-3871
URL : https://ilneige.com