タンゴチュウ
単語抽出のコツを知ろう!!
「葛の葉がうまく単語抽出してくれない(T-T)」ってなっちゃった人、ごめんね。
タンゴチュウはまだ実験段階のサービスだからうまく単語抽出できない場合もたくさんあるんだ。だけど少し工夫するだけで単語抽出できる場合もあるんだよ。葛の葉が単語抽出しやすいように写真のとり方を少し工夫して、もう1度試してくれるとうれしいな。
できるだけみんなが工夫しなくてよくなるように研究しているから応援してね。

POINT1 単語抽出の基本を知ろう。

どんな単語でも抽出できるわけではなく、いくつかの条件を満たす単語だけを抽出するよ。この条件を頭に入れた上で撮影すれば、単語抽出の成功率がUPするはずだよ!

ここからはその条件似ついて解説するね。

単語となる文字の並びだけを抽出

「お供え物は油揚げ」という文字の並びが画像に含まれていたとすると、「お供え物」と「油揚げ」という単語を抽出するよ。

日本全国の地名・施設名・企業名・人名・商品名を知っているよ。だから、石碑・看板・標識から単語抽出するのが得意なんだ。

水平方向の単語(Θ=ー45°~+45°)

文字の並びの傾きが45°以内の場合は、緑丸の「文字の傾き」「単語の傾き」「単語の方向」を有する単語(青枠)だけを抽出するよ。

水平方向の単語

垂直方向の単語(Θ=ー90°~ー45°,+45°~+90°)

文字の並びの傾きが45°以上の場合は、緑丸の「文字の傾き」「単語の傾き」「単語の方向」を有する単語(青枠)だけを抽出するよ。

垂直方向の単語

POINT2 苦手な文字や配置を知ろう。

うまく単語抽出できないときは以降の例を参考に撮影方法を工夫した上でもう一度試して欲しいな。 今は苦手な文字や配置が多いけど日々の研究のおかげで徐々に減っているよ。 前にうまく単語抽出できなかったとしても、今試すとうまく単語抽出できるんじゃないかな?

○:認識できそう

こんな風にはっきりした文字が綺麗に並んでいると単語抽出しやすいね。

○:認識できそう

×:小さすぎ

こんな風に小さいと文字がつぶれてうまく単語抽出できないよ。もっと近づいて撮影してね。

×:小さすぎ

×:細すぎ

こんな風に細いと1つの文字が途中で途切れて複数の文字に見えてうまく単語抽出できないよ。もっと近づいて撮影してね。

×:細すぎ

×:かすれぎ

こんな風にかすれていると1つの文字が途中で途切れて複数の文字に見えたり、ノイズ見たいにみえてうまく単語抽出できないよ。残念だけど撮影方法を変えるだけでは状況は改善しないね。

×:かすれぎ

×:ぼけすぎ

こんな風にぼけていると形が分からなくてうまく単語抽出できないよ。もっとピントを合わせて明るい場所で撮影してね。

×:ぼけすぎ

×:欠けすぎ

こんな風に照明で文字の一部が隠れていると形が分からなくてうまく単語抽出できないよ。障害物を避けて撮影してね。障害物には照明の他に逆光・影・物なんかがあるよ。

×:欠けすぎ

×:色が違いすぎ

こんな風に色が違うと形が分からなくてうまく単語抽出できないよ。残念だけど撮影方法を変えるだけでは状況は改善しないね。

×:色が違いすぎ

×:装飾されすぎ

こんな風に装飾されていると形が分からなくてうまく単語抽出できないよ。残念だけど撮影方法を変えるだけでは状況は改善しないね。

×:装飾されすぎ

×:周囲と似すぎ

こんな風に周囲と似ていると形が分からなくてうまく単語抽出できないよ。明るい場所で撮影するといい場合があるよ。

×:周囲と似すぎ

×:入り組み・くっつきすぎ

こんな風にくっついていると形が分からなくてうまく単語抽出できないよ。残念だけど撮影方法を変えるだけでは状況は改善しないね。

×:入り組み・くっつきすぎ

×:歪み・パースが効きすぎ

こんな風に歪んでいると形が分からなくてうまく単語抽出できないよ。角度を変えて撮影するといい場合があるよ。

×:歪み・パースが効きすぎ

×:大きさが違いすぎ

こんな風に大きさが違うと1つの単語を構成していると分からなくてうまく単語抽出できないよ。残念だけど撮影方法を変えるだけでは状況は改善しないね。

×:大きさが違いすぎ

×:曲がりすぎ

こんな風に曲がっていると1つの単語を構成していると分からなくてうまく単語抽出できないよ。残念だけど撮影方法を変えるだけでは状況は改善しないね。

×:曲がりすぎ