九州大学 研究者情報
総説一覧
内田 誠一(うちだ せいいち) データ更新日:2024.03.01

教授 /  システム情報科学研究院 情報知能工学部門 実世界ロボティクス


総説, 論評, 解説, 書評, 報告書等
1. 内田誠一, 文字とは何か? ― 深層学習により見えてきた新たな問い―, 電子情報通信学会誌(特集 深層学習は情報・システムの研究をどう変えたか), vol.105, no.5 , pp.371-374, 2022.05.
2. 内田誠一, AIとは何か? ― 入門編 ー, 土木学会誌(特集 さぁ,AIを始めよう―土木工学へのAI導入のススメ―), vol.106, no.1 , pp.12-15, 2021.01.
3. 備瀬竜馬,内田誠一, 医用画像解析におけるパターン認識, 医学のあゆみ(第五土曜特集「AIが切り拓く未来の医療」), vol.274, no.9, pp.730-736, 2020.08.
4. 内田誠一, ここに書かれているものは文字です, フェローからのメッセージ, 電子情報通信学会 情報・システムソサイエティ誌, vol.24, no.2, pp.14-15, 10.1587/ieiceissjournal.24.2_14, 2019.08.
5. 早志英朗, 安部健太郎, 備瀬竜馬, 内田誠一, 医療ビッグデータの利活用を目指した医学系学会とAI画像解析研究者との連携「九州大学の取組み:内視鏡画像診断支援の取組み」, 日本医用画像工学会(JAMIT), vol.37, no.2, pp.78–83, 10.11409/mit.37.78, 2019.03.
6. 内田誠一, 前田英作 , パターン認識・メディア理解の現状,そしてOpen Ideaへ, 電子情報通信学会誌(小特集 パターン認識・メディア理解の機能拡張に向けたOpen Idea), vol.101, no.10 , pp.991-995, 2018.10.
7. 内田誠一, 文字工学から文字科学へ~文字に関する包括的画像情報学研究の展開, 科研費ニュース, 2018年度 vol.2, pp.11, 2018.09.
8. 内田誠一, バイオイメージ・インフォマティクスの現状, 生体の科学, 2017.10.
9. 内田誠一, 認識率の先にあらゆる社会課題・学術分野が見える(電子情報通信学会創立100周年記念特集「暮らしを豊かにする情報処理技術」), 電子情報通信学会誌, 2017.10.
10. 木村 健二, 高木 潤, 庭山 律哉, 島本 勇太, 内田 誠一, 木村 暁, 細胞質流動が自発的に流れの方向をそろえるしくみ, 逆転させるしくみ, 実験医学, Vol.35, No.13, pp.2250-2253, 2017.08.
11. 内田誠一, 最適化および機械学習とバイオイメージインフォマティクス応用, 医用画像情報学会雑誌, 2017.06.
12. 内田誠一, 文字工学の今とこれから, 電子情報通信学会誌, 2017.05.
13. 内田誠一, パターン認識入門~人工知能の基盤技術, プラズマ・核融合学会誌, 2016.11.
14. 緒方 亮汰, 内田 誠一, Deformable part modelを用いた時系列パターンの識別的変動および認識応用の試み (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.115, No.457, pp.31-36, 2016.02.
15. 緒方 亮汰, 内田 誠一, Deformable part modelを用いた時系列パターンの識別的変動および認識応用の試み (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.115, No.456, pp.31-36, 2016.02.
16. 内田 誠一, 井手 将太, Dangol Dipesh, 文字認識はCNNで終わるのか? (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.115, No.457, pp.7-12, 2016.02.
17. 内田 誠一, 井手 将太, Dangol Dipesh, 文字認識はCNNで終わるのか? (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.115, No.456, pp.7-12, 2016.02.
18. 松村 高朗, 内田 誠一, CTWを用いた回転不変輪郭マッチング (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.115, No.388, pp.93-98, 2015.12.
19. 黄瀬 浩一, クンツェ カイ, 岩村 雅一, 内田 誠一, 大町 真一郎, 稲見 昌彦, Reading-Life Logへの挑戦, 情報処理学会研究報告, Vol.2015-DC-100, No.4, pp.1-8, 2015.12.
20. 品原 悠杜, 内田 誠一, word2vecを用いた情景内単語解析 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.115, No.388, pp.99-104, 2015.12.
21. 古閑 一憲, 添島 雅大, 徐 鉉雄, 板垣 奈穂, 白谷 正治, 内田 誠一, 17pCP-12 アルゴンプラズマ中微粒子運動の画像解析によるプラズマパラメータ評価, 日本物理学会講演概要集, Vol.70, No.2, 2015.09.
22. 内田 誠一, バイオイメージインフォマティクスと画像情報学, 電子情報通信学会誌 = The journal of the Institute of Electronics, Information and Communication Engineers, Vol.98, No.7, pp.597-603, 2015.07.
23. Faisal Shafait, Dimosthenis Karatzas, Seiichi Uchida, Masakazu Iwamura, Special Issue: Robust Reading Preface, INTERNATIONAL JOURNAL ON DOCUMENT ANALYSIS AND RECOGNITION, 10.1007/s10032-015-0244-0, Vol.18, No.2, pp.109-110, 2015.06.
24. 内田誠一, 数理最適化とバイオイメージ・インフォマティクス, Medical Imaging Technology (日本医用画像工学会会誌), vol.33, no.3, pp.97-104, 2015.05.
25. 黄瀬 浩一, 大町 真一郎, 内田 誠一, 岩村 雅一, 文字・文書メディアの新しい利用基盤技術の開発への取組み(総合報告), 電子情報通信学会誌, Vol.98, No.4, pp.311-327, 2015.04, "You are what you read." と言われるように,読むことは,我々の知識や人格の形成に中心的な役割を果たしている.実際,知識を追加・更新するため,我々は毎日読むことに膨大な時間を費やしている.ところが,このような努力は記録も再利用もされておらず,かけた時間に見合った価値を引き出せているとは言い難い.本稿では,読むという行動を記録し,再利用するためのリーディングライフログ(Reading-Life Log)技術について解説する.具体的には,人の読む行動と読まれる対象を相互解析することによって,読んだ文字・文書を通して人を知り,また人の読み方を通して文字・文書を知ることを実現する..
26. 黄瀬 浩一, 大町 真一郎, 内田 誠一, 岩村 雅一, 文字・文書メディアの新しい利用基盤技術の開発への取組み, 電子情報通信学会誌 = The journal of the Institute of Electronics, Information and Communication Engineers, Vol.98, No.4, pp.311-327, 2015.04, "You are what you read." と言われるように,読むことは,我々の知識や人格の形成に中心的な役割を果たしている.実際,知識を追加・更新するため,我々は毎日読むことに膨大な時間を費やしている.ところが,このような努力は記録も再利用もされておらず,かけた時間に見合った価値を引き出せているとは言い難い.本稿では,読むという行動を記録し,再利用するためのリーディングライフログ(Reading-Life Log)技術について解説する.具体的には,人の読む行動と読まれる対象を相互解析することによって,読んだ文字・文書を通して人を知り,また人の読み方を通して文字・文書を知ることを実現する..
27. 深澤 大我, フォン ヤオカイ, 内田 誠一, K-近傍弾性マッチングに関する諸検討 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.454, pp.197-202, 2015.02, 時系列パターン認識における弾性マッチングには,動的計画法による解法が広く用いられている.本報告では,動的計画法の代わりに整数線形計画法による解法を用いることで,その機能拡張を試みたK-近傍弾性マッチングを提案する.弾性マッチングは,あるパターンYを非線形時間伸縮により変形し,もう一方のパターンXに最も近づける処理である.これに対しK-近傍弾性マッチングは,互いに異なるK個の変形を同時最適化することで,Xに近づけたパターンYを複数生成する方法である.本発表では,K-近傍弾性マッチングと従来法である弾性マッチングを,オンライン文字認識に適用した場合の性能差に関する検証を行う..
28. 深澤 大我, フォン ヤオカイ, 内田 誠一, K-近傍弾性マッチングに関する諸検討 (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.455, pp.197-202, 2015.02, 時系列パターン認識における弾性マッチングには,動的計画法による解法が広く用いられている.本報告では,動的計画法の代わりに整数線形計画法による解法を用いることで,その機能拡張を試みたK-近傍弾性マッチングを提案する.弾性マッチングは,あるパターンYを非線形時間伸縮により変形し,もう一方のパターンXに最も近づける処理である.これに対しK-近傍弾性マッチングは,互いに異なるK個の変形を同時最適化することで,Xに近づけたパターンYを複数生成する方法である.本発表では,K-近傍弾性マッチングと従来法である弾性マッチングを,オンライン文字認識に適用した場合の性能差に関する検証を行う..
29. 杉本 潤, Fischer Andreas, Frinken Volkmar, 内田 誠一, グラフマッチングを用いたマルチフォント文字認識の試み (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.454, pp.13-18, 2015.02, 文字画像のグラフ化及びグラフマッチングを用いたマルチフォント文字認識手法を提案する.フォントの多様性に対して頑健である文字の局所特徴と構造を特徴抽出し利用することができれば,有効なマルチフォント文字認識手法となり得る.そこで本稿では, SURFによる特徴抽出及び相対近傍グラフ化を組み合わせた文字画像のグラフ化と,グラフ編集距離を用いたグラフマッチングによって文字認識系を構成する..
30. 杉本 潤, Fischer Andreas, Frinken Volkmar, 内田 誠一, グラフマッチングを用いたマルチフォント文字認識の試み (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.455, pp.13-18, 2015.02, 文字画像のグラフ化及びグラフマッチングを用いたマルチフォント文字認識手法を提案する.フォントの多様性に対して頑健である文字の局所特徴と構造を特徴抽出し利用することができれば,有効なマルチフォント文字認識手法となり得る.そこで本稿では, SURFによる特徴抽出及び相対近傍グラフ化を組み合わせた文字画像のグラフ化と,グラフ編集距離を用いたグラフマッチングによって文字認識系を構成する..
31. 江口 翔馬, フォン ヤオカイ, 内田 誠一, 大規模データを用いた情景内文字の色頻度解析とその検出への応用 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.454, pp.203-208, 2015.02, 情景内の文字は背景の状態や文字のフォント,撮影条件などにより検出が困難である.本研究では,文字と背景の色特徴の関係に注目する.画素単位で文字・非文字のラベルを付けた大規模な情景内文字データセットを用いて文字と背景の関係を評価し,文字検出に適用する.形特徴を用いた検出手法を基とし,色特徴を加えた検出手法と比較することで情景内文字検出における色特徴の有用性を検証する..
32. 江口 翔馬, フォン ヤオカイ, 内田 誠一, 大規模データを用いた情景内文字の色頻度解析とその検出への応用 (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.455, pp.203-208, 2015.02, 情景内の文字は背景の状態や文字のフォント,撮影条件などにより検出が困難である.本研究では,文字と背景の色特徴の関係に注目する.画素単位で文字・非文字のラベルを付けた大規模な情景内文字データセットを用いて文字と背景の関係を評価し,文字検出に適用する.形特徴を用いた検出手法を基とし,色特徴を加えた検出手法と比較することで情景内文字検出における色特徴の有用性を検証する..
33. 山口 遼, 深澤 大我, 渡辺 英治, 内田 誠一, 対象の重なりを許容した大局的最適な多物体同時追跡 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.454, pp.75-80, 2015.02, 多物体の追跡における問題の1つとして対象の重なりが挙げられる.本報告では,対象の重なりを許容した大局的最適な多物体同時追跡の手法を提案する.具体的には3段階の最適化手法を用いることで,この問題の解決を試みる.提案手法の対象の重なりに頑健な追跡結果が得られることを示すために,対象の重なりが発生する動画像を用いた検証を行った..
34. 山口 遼, 深澤 大我, 渡辺 英治, 内田 誠一, 対象の重なりを許容した大局的最適な多物体同時追跡 (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.455, pp.75-80, 2015.02, 多物体の追跡における問題の1つとして対象の重なりが挙げられる.本報告では,対象の重なりを許容した大局的最適な多物体同時追跡の手法を提案する.具体的には3段階の最適化手法を用いることで,この問題の解決を試みる.提案手法の対象の重なりに頑健な追跡結果が得られることを示すために,対象の重なりが発生する動画像を用いた検証を行った..
35. 柿迫 良輔, フリンケン フォルクマー, フォン ヤオカイ, 内田 誠一, 弾性マッチングに導入する非マルコフ的制約の検討 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.454, pp.191-196, 2015.02, 本研究では,弾性マッチングにおけるパターン間の対応付けについて,多様な制約を与えることにより,時系列パターンの認識の高精度化を検討している. 2パターン間の最適な弾性マッチングを求める方法としては動的計画法が知られている.動的計画法では制約条件としてマルコフ的制約,つまり隣接時刻での関係しか制約できないという限界がある.すなわち,非隣接時刻間のマッチングの詳細な制御はできなかった.動的計画法の代わりにグラフカットを利用する解法によりその限界を解消する手法が提案された.非マルコフ的制約下において,時系列パターンの認識の高精度化に有効な制約について検討する..
36. 柿迫 良輔, フリンケン フォルクマー, フォン ヤオカイ, 内田 誠一, 弾性マッチングに導入する非マルコフ的制約の検討 (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.455, pp.191-196, 2015.02, 本研究では,弾性マッチングにおけるパターン間の対応付けについて,多様な制約を与えることにより,時系列パターンの認識の高精度化を検討している. 2パターン間の最適な弾性マッチングを求める方法としては動的計画法が知られている.動的計画法では制約条件としてマルコフ的制約,つまり隣接時刻での関係しか制約できないという限界がある.すなわち,非隣接時刻間のマッチングの詳細な制御はできなかった.動的計画法の代わりにグラフカットを利用する解法によりその限界を解消する手法が提案された.非マルコフ的制約下において,時系列パターンの認識の高精度化に有効な制約について検討する..
37. 佐藤 洪太, 江頭 勇治, フォン ヤオカイ, 内田 誠一, 文字の自動デザインに関する研究 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.454, pp.1-6, 2015.02, フォントの自動デザインは,デザイナの労力低減や人間のデザイン方法論の解明など,実用的にも基礎的にも興味深い課題である.しかしながら実用レベルでの研究は著者らの知る限りわずかである.本報告ではフォントの自動デザインのための試みとして,大量のフォントを集めた上で,それらの中に潜む類似関係を,ネットワークで構造的に表現しながら,内挿の考えに基づいたフォントの自動デザインを目指している.具体的には,作成したネットワークの経路を利用しながら,類似フォントの非線形内挿に基づく2枚のフォント画像の合成を行なう.非線形内挿の方法として,フォントの輪郭線上の画素に基づいた方法とフォントの輪郭線を描画する制御点に基づいた方法の2つを試みる..
38. 佐藤 洪太, 江頭 勇治, フォン ヤオカイ, 内田 誠一, 文字の自動デザインに関する研究 (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.455, pp.1-6, 2015.02, フォントの自動デザインは,デザイナの労力低減や人間のデザイン方法論の解明など,実用的にも基礎的にも興味深い課題である.しかしながら実用レベルでの研究は著者らの知る限りわずかである.本報告ではフォントの自動デザインのための試みとして,大量のフォントを集めた上で,それらの中に潜む類似関係を,ネットワークで構造的に表現しながら,内挿の考えに基づいたフォントの自動デザインを目指している.具体的には,作成したネットワークの経路を利用しながら,類似フォントの非線形内挿に基づく2枚のフォント画像の合成を行なう.非線形内挿の方法として,フォントの輪郭線上の画素に基づいた方法とフォントの輪郭線を描画する制御点に基づいた方法の2つを試みる..
39. 井手 将太, 佐藤 洪太, フォン ヤオカイ, 内田 誠一, 最適化に基づくクラス境界解析 (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.455, pp.159-164, 2015.02, 昨今の計算機能力の向上により,大量のデータを用いたパターン識別が可能になってきた.しかし,パターン分布の様子は解明されていないことが多い.そこで,本研究は大量のパターンを用いて高次元特徴空間におけるパターン分布の「真のクラス境界」の解析を目標とする.解析の際にはパターン分布を相対近傍グラフ(RNG)で表現し,その近傍性を基準とした最適分割を行う.最適分割の方法はグラフカットを採用する.パターンのクラスラベルと相対近傍グラフの構造によって定義されるクラス境界に対し,最適分割の解を比較することで,クラス境界の複雑度を理解することができると考え解析を行った..
40. 井手 将太, 佐藤 洪太, フォン ヤオカイ, 内田 誠一, 最適化に基づくクラス境界解析 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.454, pp.159-164, 2015.02, 昨今の計算機能力の向上により,大量のデータを用いたパターン識別が可能になってきた.しかし,パターン分布の様子は解明されていないことが多い.そこで,本研究は大量のパターンを用いて高次元特徴空間におけるパターン分布の「真のクラス境界」の解析を目標とする.解析の際にはパターン分布を相対近傍グラフ(RNG)で表現し,その近傍性を基準とした最適分割を行う.最適分割の方法はグラフカットを採用する.パターンのクラスラベルと相対近傍グラフの構造によって定義されるクラス境界に対し,最適分割の解を比較することで,クラス境界の複雑度を理解することができると考え解析を行った..
41. 江頭 勇治, フォン ヤオカイ, 内田 誠一, 輪郭制御点摂動に基づく多フォント同時アライメント (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.454, pp.7-12, 2015.02, 我々の日常生活には多種多様なフォントが存在する.こうしたフォントを工学的に取扱う場合に如何にフォントの分布を解析するのか,という検討課題がある.本報告の目的は,フォントの分布解析の一つとして,様々なフォントの標準形状を探ることにある.この標準形状を求める手段として,前報ではフォント画像に対して既存手法であるCongealingを用いた.本報告ではフォントの輪郭線を構成する制御点を摂動し, Congealingの枠組みで多様なフォント画像を同時にアライメントし,どのようなフォントの標準形状が得られるかを確認する..
42. 江頭 勇治, フォン ヤオカイ, 内田 誠一, 輪郭制御点摂動に基づく多フォント同時アライメント (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.455, pp.7-12, 2015.02, 我々の日常生活には多種多様なフォントが存在する.こうしたフォントを工学的に取扱う場合に如何にフォントの分布を解析するのか,という検討課題がある.本報告の目的は,フォントの分布解析の一つとして,様々なフォントの標準形状を探ることにある.この標準形状を求める手段として,前報ではフォント画像に対して既存手法であるCongealingを用いた.本報告ではフォントの輪郭線を構成する制御点を摂動し, Congealingの枠組みで多様なフォント画像を同時にアライメントし,どのようなフォントの標準形状が得られるかを確認する..
43. 徳永 誠, 深澤 大我, Frinken Volkmar, フォン ヤオカイ, 内田 誠一, 非マルコフ制約を導入した多物体追跡 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.454, pp.81-86, 2015.02, 本稿では多物体追跡問題に対して,非マルコフ的性質を考慮した追跡手法を提案する.非マルコフ性とは,離れた時刻間の追跡対象の関係性で表現される.これにより周期性といった追跡対象の規則性のある行動をモデル化できるようになり,よりロバストな追跡が期待できる.多物体追跡を最小費用流問題として捉え,線形計画法にて定式化することで非マルコフ的制約を導入可能にしている..
44. 徳永 誠, 深澤 大我, Frinken Volkmar, フォン ヤオカイ, 内田 誠一, 非マルコフ制約を導入した多物体追跡 (クラウドネットワークロボット), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.114, No.455, pp.81-86, 2015.02, 本稿では多物体追跡問題に対して,非マルコフ的性質を考慮した追跡手法を提案する.非マルコフ性とは,離れた時刻間の追跡対象の関係性で表現される.これにより周期性といった追跡対象の規則性のある行動をモデル化できるようになり,よりロバストな追跡が期待できる.多物体追跡を最小費用流問題として捉え,線形計画法にて定式化することで非マルコフ的制約を導入可能にしている..
45. 松田 修, 末次 憲之, 内田 誠一, 和田 正三, 射場 厚, 近接ハイパースペクトルイメージングに基づく植物遺伝学研究の新展開(植生のリモートセンシング), 日本生態学会誌, 10.18960/seitai.64.3_205, Vol.64, No.3, pp.205-213, 2014.11, 生物科学の研究では、材料やスケールを問わず、対象物を見分ける必要に迫られることが多い。その際、私たちが最も頻繁に参照する形質は、言うまでもなく目に見える形や色である。しかしながら、私たちはこれらの情報を十分に活用できているだろうか。とりわけ色に関しては、定量的な情報として注意深く扱われていることは稀である。一方、衛星や航空機によるリモートセンシングでは、精密な色情報とも言える分光特性が、地上にある対象物を定量または識別するための主要な鍵情報として活用されている。筆者らは、高精細な分光データを保持することができるハイパースペクトル画像を、ノイズの少ない撮影条件と遺伝的に均質なモデル植物の利点を生かすことのできる実験室において活用することにより、組織または細胞レベルの生理的状態を精度よく予測するための実験系の構築に取り組んでいる。本稿では遺伝学研究にリモートセンシングの異分野技術を取り入れる試みを紹介するが、生態学における同技術の新たな活用法を案出する有用な手がかりとなることを願いたい。.
46. 濱野 あゆみ, 朽名 夏麿, 藤森 俊彦, 立石 和博, 月田 早智子, 内田 誠一, バイオイメージインフォマティクスに関する諸検討(経過報告) (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.113, No.493, pp.67-72, 2014.03, 蛍光技術の発展と顕微鏡の高精度化に伴い,細胞やその内部における様々な生命現象がイメージングできるようになった.それらのイメージング結果はバイオイメージと呼ばれ,定性的または定量的な解析に利用されている.しかし,バイオイメージに対する定量解析法は確立されておらず,依然として生物学研究者の目視に依るところが大きい.このような状況から,本研究では画像処理.認識技術を用いた定量解析法の開発を目的としている.本稿では,今日までに取り扱った事例の中より速度解析,特定領域アライメント,線構造の検出の3つの事例を紹介し,それぞれに対する定量解析の提案手法及び実験結果について報告する..
47. 後藤 雅典, 石田 良介, 蔡 文杰, 内田 誠一, 最小全域木による大規模パターンの分布解析(画像認識,コンピュータビジョン), 電子情報通信学会論文誌. D, 情報・システム, Vol.97, No.3, pp.656-666, 2014.03, 本研究の究極の目標は,「パターンの真の分布」を解明することである.その際.単一のクラスの分布だけでなく,複数クラス間の関係も解明の対象とする.パターン空間に存在しうる全てのパターンを収集するのは実現不可能なため,できる限り多くのクラスラベル付きパターンを収集した上で,その分布構造を解析することで,この目標に挑む.真の分布の解明を目指す以上,解析手法として,何らかのモデルによる近似や低次元化など,パターン間の近傍関係に誤差が入り得るものは適切でない.そこで本論文では,パターンの相対位置関係を誤差なく保存しうるネットワーク解析手法により大規模パターンの分布構造の解析を行う.具体的には,各パターンを1ノードとし,その近傍関係によりエッジを付与してネットワークを構成し,その構造を解析する.本論文では,ネットワークの作成手法として最小全域木を適用し,分布解析の対象として約50万個の活字数字画像と約80万個の手書き数字画像を用いた実施例を示し,パターン数の増加によるパターン分布の変化を明らかにする..
48. 武部 浩明, 内田 誠一, 最適2次元セグメンテーションによる情景内文字抽出(画像認識,コンピュータビジョン), 電子情報通信学会論文誌. D, 情報・システム, Vol.97, No.3, pp.667-675, 2014.03, 情景内文字認識において,情景画像から文字領域を正しく抽出することは重要である.しかし,情景内文字は多様な文字配置と複雑な照明・外光条件を伴うため,文字抽出は依然未解決の課題である.本論文では,画像の部分領域に対する文字/非文字の識別器として文字認識を用いながら,最適な2次元セグメンテーションを併用することで,極力高精度に文字抽出を行う手法を提案する.本手法は,2値化のしきい値を段階的に変えて得られる2値画像集合の中に各文字が明瞭に現れる段階が含まれることに着目し,2値画像集合における個々の連結成分を文字仮説とする多重仮説を生成する.そして,2次元最適化の枠組みで,文字仮説の近傍を考慮しながら最適な仮説を選択することによって文字抽出を行う.以上の考え方を,しきい値を変えながら得られた文字認識結果をノードとするコンポーネント・ツリーとグラフカットを利用して実現する..
49. 深澤 大我, 藤崎 顕彰, フォン ヤオカイ, 内田 誠一, K-近傍弾性マッチングを用いたオンライン文字認識(ポスターセッション,パターン認識・メディア理解の基礎と境界領域,環境・エネルギーの課題,ポスターセッション), 電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット, Vol.113, No.432, p.117, 2014.02, 時系列パターン認識における弾性マッチングには,動的計画法による解法が広く用いられている.本報告では,動的計画法の代わりに整数線形計画法による解法を用いることで,その機能拡張を試みたK-近傍弾性マッチングを提案する.従来の弾性マッチング法は,あるパターンYを非線形時間伸縮により変形し,もう一方のパターンXに最も近づける処理である.これに対しK-近傍弾性マッチングは,互いに異なるK個の変形を同時最適化することで,Xに近づけたパターンYを複数生成する方法である.本発表では,K-近傍弾性マッチングと従来の弾性マッチングを,オンライン文字認識に適用した場合の性能差に関する検証を行う..
50. 深澤 大我, 藤崎 顕彰, フォン ヤオカイ, 内田 誠一, K-近傍弾性マッチングを用いたオンライン文字認識(ポスターセッション,パターン認識・メディア理解の基礎と境界領域,環境・エネルギーの課題,ポスターセッション), 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.113, No.431, p.117, 2014.02, 時系列パターン認識における弾性マッチングには,動的計画法による解法が広く用いられている.本報告では,動的計画法の代わりに整数線形計画法による解法を用いることで,その機能拡張を試みたK-近傍弾性マッチングを提案する.従来の弾性マッチング法は,あるパターンYを非線形時間伸縮により変形し,もう一方のパターンXに最も近づける処理である.これに対しK-近傍弾性マッチングは,互いに異なるK個の変形を同時最適化することで,Xに近づけたパターンYを複数生成する方法である.本発表では,K-近傍弾性マッチングと従来の弾性マッチングを,オンライン文字認識に適用した場合の性能差に関する検証を行う..
51. 濱野 あゆみ, 朽名 夏麿, 藤森 俊彦, 立石 和博, 月田 早智子, 内田 誠一, 生物学との協働を目指したバイオイメージ・インフォマティクス(ポスターセッション,パターン認識・メディア理解の基礎と境界領域,環境・エネルギーの課題,ポスターセッション), 電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット, Vol.113, No.432, pp.113-114, 2014.02, 可視化技術の発展により,細胞内における生命現象は静止画像・動画像の形で撮像できるようになった.その一方で,それらの画像群に対する解析は,依然として生物学研究者の目視によるところが大きい.このような状況から,本研究では画像処理・認識技術を利用した定量解析法の開発を目的としている.本稿では,今日までに本研究で取り扱った事例の紹介を行う..
52. 濱野 あゆみ, 朽名 夏麿, 藤森 俊彦, 立石 和博, 月田 早智子, 内田 誠一, 生物学との協働を目指したバイオイメージ・インフォマティクス(ポスターセッション,パターン認識・メディア理解の基礎と境界領域,環境・エネルギーの課題,ポスターセッション), 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.113, No.431, pp.113-114, 2014.02, 可視化技術の発展により,細胞内における生命現象は静止画像・動画像の形で撮像できるようになった.その一方で,それらの画像群に対する解析は,依然として生物学研究者の目視によるところが大きい.このような状況から,本研究では画像処理・認識技術を利用した定量解析法の開発を目的としている.本稿では,今日までに本研究で取り扱った事例の紹介を行う..
53. 江口 翔馬, フォン ヤオカイ, 内田 誠一, 色空間における情景文字の特徴に関する研究(ポスターセッション,パターン認識・メディア理解の基礎と境界領域,環境・エネルギーの課題,ポスターセッション), 電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット, Vol.113, No.432, pp.121-122, 2014.02, 情景内の文字は極めて多様である一方,文字に使われやすい色や文字と背景の典型的な配色など,統計的に見れば何らかの傾向があると予想される.本報告では,この予想の正否を確認すべく,画素単位で文字・非文字のラベルを付けた大量の情景内画像データセットを用いて,文字と背景の色特徴の関係を定量的に評価する..
54. 江口 翔馬, フォン ヤオカイ, 内田 誠一, 色空間における情景文字の特徴に関する研究(ポスターセッション,パターン認識・メディア理解の基礎と境界領域,環境・エネルギーの課題,ポスターセッション), 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.113, No.431, pp.121-122, 2014.02, 情景内の文字は極めて多様である一方,文字に使われやすい色や文字と背景の典型的な配色など,統計的に見れば何らかの傾向があると予想される.本報告では,この予想の正否を確認すべく,画素単位で文字・非文字のラベルを付けた大量の情景内画像データセットを用いて,文字と背景の色特徴の関係を定量的に評価する..
55. 上村 将之, フリンケン フォルクマー, フォン ヤオカイ, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 認識に基づくReading-Life Logのための諸検討(ポスターセッション,パターン認識・メディア理解の基礎と境界領域,環境・エネルギーの課題,ポスターセッション), 電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット, Vol.113, No.432, pp.115-116, 2014.02, 日常的に人間が読んでいる文字を自動的に認識し,記録できれば極めて有用である.我々はこれをReading-Life Logと呼び,人間の行動履歴の索引化等を考えている.実現のためには,人間が読んでいる範囲の画像を取得し,その取得した画像に対して文字認識を行うシステムが必要となる.本稿では,Reading-Life Logのシステムの実装に際して,認識処理部に着目し,認識処理の計算コスト削減と認識精度の向上を図る.計算コスト削減のためにSURF特徴量を用いた対応点の特徴付けを用いた手法,また,認識精度の向上のために超解像を用いた手法について検討を行う..
56. 上村 将之, フリンケン フォルクマー, フォン ヤオカイ, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 認識に基づくReading-Life Logのための諸検討(ポスターセッション,パターン認識・メディア理解の基礎と境界領域,環境・エネルギーの課題,ポスターセッション), 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.113, No.431, pp.115-116, 2014.02, 日常的に人間が読んでいる文字を自動的に認識し,記録できれば極めて有用である.我々はこれをReading-Life Logと呼び,人間の行動履歴の索引化等を考えている.実現のためには,人間が読んでいる範囲の画像を取得し,その取得した画像に対して文字認識を行うシステムが必要となる.本稿では,Reading-Life Logのシステムの実装に際して,認識処理部に着目し,認識処理の計算コスト削減と認識精度の向上を図る.計算コスト削減のためにSURF特徴量を用いた対応点の特徴付けを用いた手法,また,認識精度の向上のために超解像を用いた手法について検討を行う..
57. 吉岡 大貴, 横山 諒平, 劉 傳軍, 小野寺 武, 内田 誠一, 中野 幸二, 林 健司, 匂い空間のマルチスペクトルイメージング (MEとバイオサイバネティックス), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.113, No.409, pp.53-56, 2014.01, 匂いは目に見えないが,危険信号として重要な情報を持つ.匂いは気体であるため,匂い情報として匂い物質の種類,濃度,空間分布が考えられる.本研究では匂い物質を可視化するために蛍光物質を混ぜたアガロースゲルフィルムを蛍光プローブとして用い,匂い情報を蛍光変化として取り出している.本稿では,蛍光物質を複数用いたマルチ蛍光プローブを用いてマルチスペクトルイメージングを行い,匂い物質の識別を行っている.また,混合匂いに対するマルチ蛍光プローブの反応は各匂い物質毎の各単一蛍光プローブの反応に分割できるため,混合匂いを含めた匂い濃度の空間分布を識別することができる..
58. 江頭 勇治, フォン ヤオカイ, 内田 誠一, Congealingを用いた多フォントの共通形状抽出 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.113, No.346, pp.127-132, 2013.12, 本研究の最終的な目標は,「文字Aとは何か?」という古くから言われている問題に解決を与えることにある.模索しつつある解決法の一つが,様々なフォントの共通形状である.すなわち,全てのフォントは,文字Aの共通形状からの派生であると仮想する.異体字の存在などを考えると,この仮想は十分ではない,すなわち文字Aは単一ではなく,複数の基本形状がある可能性もある.しかしながら,いずれも可能性であり,まずは共通形状を求める試みから始めるべきであろう.この共通形状を求める手段として,本稿では,Congealingと呼ばれる既存手法を用いる.これは,複数の画像パターンを同時にアライメントする手法である.複数フォントを単純平均して共通形状を求めれば,単にぼけた平均パターンが得られるのに対し,Congealingではある程度の線形(もしくは非線形)の変換を施した上で平均を取るため,こうしたぼけを極小化できる.さらに,何らかの単一の基準に対してアライメントを施すのではなく,相互に摂動させながら妥協点を見出す手法であり,この意味で,本研究課題の目標に合致している.本稿では1000種類のフォントをCongealingにより同時アライメントし,どのような共通形状が得られるかを確認する..
59. 緒方 亮汰, 森 稔, 内田 誠一, 全順序性を持つ大局的特徴系列の選択とその利用 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.113, No.346, pp.79-84, 2013.12, 時系列データの離れた時刻間の関係を抽出した大局的特徴を利用可能なDPマッチングの処理スキームを提案する.具体的には,任意の2時刻間で定義される大局的特徴群から,全順序性を満たしつつ高い識別能力を持つ特徴を選択することで,DPマッチングへの適用を実現する.オンライン数字データを用いて評価実験を行い,その結果についての考察を行った..
60. 小泉 壮太, フォン ヤオカイ, 内田 誠一, 可読性を考慮した検出しやすい文字パターンの検討 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.113, No.346, pp.17-22, 2013.12, 情景画像中で,検出が容易となる文字パターンの生成について検討する.従来の文字領域検出処理は,あらゆる文字パターが共通して持つ普遍的な特徴を用いて文字領域と非文字領域を識別することで実現される.しかし用いた特徴では検出できない例外的なパターンが存在したり,検出対象が存在する環境によっては検出が極めて困難になるなどの問題も多い.本研究では,検出が容易となる特徴を備えた文字パターンを生成するという視点からこの問題を捉える.先行研究で,部分空間法を応用した文字パターンの生成手法が提案されており,検出特徴,文字分有,非文字分布,パターン間の距離を定義している.文字分布を定義するフォントには様々なものが考えられ,その一つが本稿でも取り扱う可読性の高いフォントである.本稿では可読性の高いフォントのみを文字分布の作成に使用することで,検出容易な文字の選出結果がどのように変化するかについて報告する..
61. 岩切 裕太郎, フォン ヤオカイ, 内田 誠一, 大規模事例に基づく動画像推定のための対象の動き表現 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.113, No.346, pp.109-114, 2013.12, 本研究では,大規模な動画像データベースを用いた事例ベースの動画像推定について検討する.ここで動画像推定とは,ある情景を写した1枚の静止画像からその画像に至る動画像を予測する問題であるとする.このような問題を解くために,事例データベースの類似事例を適切に参照しながら,新たな画像を合成するという方針を採る.本発表では主に画像合成における対象物体の動きの表現方法について報告する..
62. 内田 誠一, 柿迫 良輔, 深澤 大我, フリンケン フォルクマー, フォン ヤオカイ, 弾性マッチング二題 : 最適化法を変えて広がる応用 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.113, No.346, pp.91-96, 2013.12, 弾性マッチングは,音声認識や文字認識,ステレオマッチング等に広く用いられている.一種の最適化問題として定式化され,その大局的最適解は,多くの場合,動的計画法を用いて求めることができる.ところで,大局的最適解は,他の方法でも求めることができる.例えばグラフカットや整数線形計画法である.本稿では,動的計画法以外の大局的最適化手法を用いることで,従前より機能強化された弾性マッチングを実現できることを紹介する..
63. Kai Kunze, Masakazu Iwamura, Koichi Kise, Seiichi Uchida, Shinichiro Omachi, Activity Recognition for the Mind: Toward a Cognitive "Quantified Self", IEEE Computer, 2013.10.
64. 藤崎 顕彰, フォン ヤオカイ, 内田 誠一, 荒関 雅彦, 齋藤 有紀, 鈴木 利治, ネットワークフロー最適化手法に基づく細胞内粒子群の追跡 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.113, No.230, pp.41-46, 2013.10, 蛍光顕微鏡により撮影されたノイズが多くてカラー情報もない細胞内動画像について,その細胞内を移動する粒状物質の追跡を試みる.同動画像中には類似形状の粒子が複数同時に存在し,それら粒子の追跡が困難である.本稿では,ネットワークフロー最適化問題の解法を用いて,複数経路を同時に大局的最適化する.この手法は,条件付き整数計画問題が線形計画問題に緩和できる特性を利用していることから高速に計算できる.本手法による実験結果を生物学的専門家と共同で作成したGround-Truthと比較しながら考察する..
65. 石田 良介, 後藤 雅典, フォン ヤオカイ, 内田 誠一, 相対近傍グラフによるパターン分布構造の解析 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, Vol.113, No.230, pp.47-52, 2013.10, 計算機の著しい性能向上によって,大量のパターンを用いた認識実験が盛んに行われている.もし,大規模パターンを用いて,パターンの真の分布について知見を得ることができれば,認識手法を改善するうえで非常に有用な情報となるであろう.そこで本研究では,大規模パターンの分布解析を通して,パターンの真の分布を解明することを最終的な目標とする.具体的には,パターンの近傍情報を基に構成したネットワークにより分布を表現し,その構造を解析することで大規模パターンの分布構造を推定する.本稿では,ネットワークとして相対近傍グラフを採用し,約40万個の活字数字画像および約60万個の手書き数字画像を分布解析の対象とした実施例を示す.そして,ネットワークを用いた大規模パターンの分布構造解析手法の有用性を検証する..
66. 内田 誠一, 1. バイオイメージ・インフォマティクス概要(バイオイメージ・インフォマティクス), 映像情報メディア学会誌 : 映像情報メディア, Vol.67, No.9, pp.737-741, 2013.09.
67. 江頭勇治, フォン ヤオカイ, 内田誠一, Congealingによる多フォント同時アライメント, 電気関係学会九州支部連合大会講演論文集(CD-ROM), Vol.66th, p.ROMBUNNO.02-2P-03, 2013.09.
68. 上村将之, フォン ヤオカイ, 内田誠一, 岩村雅一, 大町真一郎, 黄瀬浩一, Reading‐Life Logにおける追跡の利用, 電気関係学会九州支部連合大会講演論文集(CD-ROM), Vol.66th, p.ROMBUNNO.02-2A-09, 2013.09.
69. 山口遼, 浜野あゆみ, 落合悠太, 塚田祐基, 森郁恵, 内田誠一, クラスタリングによる線虫の挙動解析, 電気関係学会九州支部連合大会講演論文集(CD-ROM), Vol.66th, p.ROMBUNNO.02-2A-10, 2013.09.
70. 藤崎顕彰, フォンヤオカイ, 内田誠一, 荒関雅彦, 齋藤有紀, 鈴木利治, ネットワークフロー最適化手法に基づく細胞内粒子群の追跡, 電子情報通信学会技術研究報告, Vol.113, No.230(PRMU2013 56-67), pp.41-46, 2013.09.
71. 緒方亮汰, 森稔, 内田誠一, 全順序性を持つ大局的特徴系列の選択, 電気関係学会九州支部連合大会講演論文集(CD-ROM), Vol.66th, p.ROMBUNNO.02-2P-06, 2013.09.
72. 深澤大我, 藤崎顕彰, フォン ヤオカイ, 内田誠一, 弾性マッチング問題の線形計画法による解法, 電気関係学会九州支部連合大会講演論文集(CD-ROM), Vol.66th, p.ROMBUNNO.02-2P-04, 2013.09.
73. 江口翔馬, フォン ヤオカイ, 内田誠一, 情景内画像における文字・非文字領域の差異について, 電気関係学会九州支部連合大会講演論文集(CD-ROM), Vol.66th, p.ROMBUNNO.02-2P-07, 2013.09.
74. 石田良介, 後藤雅典, 後藤雅典, フォンヤオカイ, 内田誠一, 相対近傍グラフによるパターン分布構造の解析, 電子情報通信学会技術研究報告, Vol.113, No.230(PRMU2013 56-67), pp.47-52, 2013.09.
75. 森稔, 内田誠一, 坂野鋭, 大局的特徴に対するDPマッチング, 電子情報通信学会論文誌 D, Vol.J96-D, No.7, pp.1654-1657, 2013.07, 時系列データの離れた時刻間の関係を抽出した大局的特徴を利用可能なDPマッチングの処理スキームを提案する.具体的には,任意の2時刻間で定義される大局的特徴群から,マルコフ性を満たしつつ識別能力も備える特徴を選択することで,大局的特徴へのDPマッチング適用を実現する.オンライン数字データを用いた評価実験で,提案手法の有効性を確認した..
76. 木村 崇志, フォン ヤオカイ, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, リーディングライフ・ログ, 第19回 画像センシングシンポジウム(SSII2013), Vol.19, 2013.06.
77. 木村 崇志, ヤオカイ フォン, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, Reading-Life Logの実装(テーマセッション,文字・文書の認識と理解及びアルゴリズム・システム評価), 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.112, No.495, pp.231-236, 2013.03, 日々目で見て読んでいる文字を自動的に認識舌上で記録できれば,極めて有用と考えられる.我々はこれをReading-Life Logと呼び,人間の行動履歴の検索等への応用を考えている.実現のためには,読んでいる箇所の画像と文字の認識技術が必要となる.本研究では,視界中央にある文字を読んでいる文字と仮定し,高解像度,高シャッタースピードのカメラを用い画像を取得する.そして,画像をOCRエンジンに入力し認識結果を得る.得られた認識結果は,フレーム間で独立しているため,一種の2次元DPマッチングによる認識結果の統合を行い,読んだ文字集合を得る.本稿では,以上のシステムで屋内,屋外などの様々な環境や条件下で実験を行い,Reading-Life Logシステムの検証を行った..
78. 松尾 崇史, フォン ヤオカイ, 内田 誠一, part-basedオンライン文字認識における特徴表現に関する検討 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.495, pp.219-224, 2013.03, 本研究では,従来のオンライン文字認識手法と異なるアプローチとして,パターンの大局的な情報を排除したオンライン文字認識,すなわちpart-basedオンライン文字認識の可能性について研究を行なっている.特に,パターンを時間的に断片化し,それらの断片の情報のみを用いた認識手法について検証している. part-basedオンライン文字認識では,大局的情報をあえて捨てることで,筆順変動や画数変動に頑健な認識が行えるという利点がある.本報告では,part-basedオンライン文字認識手法として,Bag-of-Featuresに加えて,スパースコーディングとプーリングを組み合わせた手法を比較する.漢字データベースを用いた認識実験の結果,Bag-of-Featuresを用いた場合に,プーリングの手法よりも高い約55%の認識率が得られた.また,従来手法であるDPマッチングとの比較により,part-based認識手法は認識精度は劣る一方で,学習パターンにない変動が生じたパターンを認識可能であることが分かった..
79. 中本 千尋, 小泉 壮太, 石田 良介, ヤオカイ フォン, 内田 誠一, フォントネットワーク : 大規模フォントセットの分布構造解析 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.495, pp.69-74, 2013.03, 文字認識に関する未解決問題に,フォントごとに異なる多様な字体の抽象的な特性をどのように一つの概念として捉え,機械に認識させるかというものがある.本研究では,この字体の特性の問題を考えた.具体的な取り組み方として,フォント大量データを用いてネットワークを構築し,それを多様な観点で解析していくことにより,その特徴や共通項,特性から文字が持つ根本の構造概念の考察へと繋げる.本稿では大量のフォントの文字画像を用い,フォントネットワークを生成し,それによりフォントの分布構造を把握した.ここでフォントネットワークの構造としては,最小全域木(Minimum Spanning Tree,MST)を使用した..
80. 村山 修一, フォン ヤオカイ, 内田 誠一, 位置同定における局所特徴の選択に関する考察 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.495, pp.123-128, 2013.03, 画像を用いた位置同定とは,撮影地点既知の参照画像群を用いて入力画像の撮影地点を求めるものである.その手法の一つとして,局所特徴を用いた多数決法がある.この手法では,参照画像群と入力画像の各画像から多数の局所特徴を抽出する.そして,人力画像から得られた局所特徴について,参照画像群から得られた局所特徴のうち,最も似ているものを探す.これにより,人力画像の各局所特徴,すなわち各局所領域について,それらがどの撮影地点であるかの認識がなされたことになる.全ての局所領域が同じ撮影地点として認識されるわけではないので,多数決を行うことで画像としての認識結果を求める.ところで局所特徴は高次元特徴であるため,最近傍特徴の有意性が低い,すなわち最近傍特徴とその他の近傍特徴が同程度の類似性を持ってしまう可能性がある.そのような特徴の近傍探索の結果は信頼できず,多数決に悪影響を与えると考えられる.そこで,最近傍特徴の有意性という尺度を用いて,局所特徴の近傍探索の結果の信頼度に重みづけを行い,信頼度の高い特徴を選択し多数決を行う.この手法と有意性を用いない場合の多数決法との結果の比較を行い,考察を行った..
81. 柿迫 良輔, 石田 良介, フォン ヤオカイ, 内田 誠一, 分布構造を利用した半教師付き学習による文字認識 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.495, pp.117-122, 2013.03, パターン認識のために大規模データの利用が検討されている.文字認識の分野でも,大規模データから学習を行い認識するという方法が考えられる.本研究では大規模データにラベル付きデータとラベル無しデータ両方を用いた学習,すなわちいわゆる半教師付き学習を対象として,その認識性能および学習の過程の観察を目的とする.具体的な半教師付き学習法としては,ラベル付き・ラベル無し両方を含む大規模データをあらかじめネットワーク化し,そのネットワーク上での測地線距離を利用して文字認識を行う手法を採る.データセットとして約80万のラベル付き手書き数字パターン集合を準備し,それらをラベル付き学習データ,ラベル無し学習データ,テストデータに3分割して,認識率を評価する.この際,ラベル無しとして扱ったデータ群も実際にはラベルが付いていることを利用して,本学習法の挙動を観察する..
82. 佐藤 洪太, フォン ヤオカイ, 内田 誠一, 大規模パターンを使ったSelf-Corrective Learningの挙動解析に関する研究 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.495, pp.111-116, 2013.03, Self-Corrective Learning(SCL)とは,パターン認識において未知入力パターンとその認識結果を正誤に関わらず以降の学習パターンとして追加利用する手法である.1960年代に提案された同手法は,最も基本的なオンライン学習法でもあると同時に,最も基本的な半教師付き学習法でもある.その後の報告によれば,SCLを行うと識別器の性能が向上することが知られている.その一方で,その向上原理の解析については十分になされていない.そこで本稿では,大規模なラペル付き手書き数字データを用いて条件を変えながらSCLを行い,その挙動を調べた結果について報告する..
83. 寺田 有吾, フォン ヤオカイ, 内田 誠一, 属性付き構造学習を用いた情景内文字認識 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.495, pp.225-230, 2013.03, 本研究では,文字の位相構造を学習し識別することで,情景画像中の文字領域の検出を行なう手法を提案する.すなわち,文字・非文字の持つ多様な構造のうち特有のものを学習により発見し,情景画像内の部分にその構造が含まれているか否かで,その部分が文字か非文字であるかを識別する.また,グラフとして表現されるこの位相構造について,さらに属性を付加すれば,位相構造のみで識別する場合に比べて,より正しい識別結果が得られると考えられる.本報告では,これらの試みを説明する..
84. 稲井 浩平, フォン ヤオカイ, 内田 誠一, 文字の選択的隠蔽に向けた試み : 文字で文字を隠蔽できるか? (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.495, pp.37-42, 2013.03, ナンバープレートなどの文字による個人情報を含む画像がウェブ上で公開する場合,適切なプライバシー保護を行う必要が議論されている.ナンバープレートなど,情景中の様々な文字情報も保護対象になり得る.このため,自動で情景中の文字部分を検出し,隠蔽処理を行なう必要がある.本研究では,文字が独特の被隠蔽特性を持つことを利用し,文字の可読性を失わせるとともに,不可避な誤検出部分すなわち非文字部分に対する悪影響が最低限になる隠蔽処理を考える.具体的には,テクスチャ合成法の一種であるimage inpaintingを用い,文字のストローク構造の破壊を意図した隠蔽法を提案する.本手法の効果を確認するために,ナンバープレートの文字隠蔽実験を行ない,まず目視による評価を行った.更に,より詳細な文字隠蔽性能の評価を行うべく,単一文字を対象として,様々な文字構造破壊を試み,その可読性の低下の効果を主観評価実験により定量化した..
85. 松田修, 末次憲之, 内田誠一, 和田正三, 射場厚, 非侵襲的な分光画像撮影による葉緑体機能異常の特異的検出の試み, 日本植物生理学会年会要旨集, Vol.54th, p.176, 2013.03.
86. 吉田 龍生, フォン ヤオカイ, 内田 誠一, カメラ・プロジェクタシステムを用いたタッチスクリーンの構築 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.357, pp.55-60, 2012.12, 本研究の目的は,プロジェクタから投影されたスクリーン上でタッチスクリーン操作を実現することである.その一つの手段として,スクリーンのタッチパネル化が考えられる.しかし,タッチパネルの大型化にはコスト面での課題が残る.そこで,カメラ・プロジェクタシステムを用いることを考える.カメラ・プロジェクタシステムとは,既存のプロジェクタシステムにカメラを備えつけ,そのカメラから得られる情報とプロジェクタの特性を活かし,構築するシステムである.本研究において,構築するシステムに用いるカメラは,web カメラ1 台と限定する.そうすることで,タッチパネルの大型化に残るコスト面での課題を克服することが可能である.カメラ・プロジェクタシステムによるタッチスクリーン操作の実現には,指領域の検出,スクリーンへの接触検知,トラッキングが必要となる.本稿では,まず指領域の検出及びスクリーンへの接触検知の方法について述べる.そして,トラッキングの手法を提示し,その手法による実験を行ない,タッチスクリーン実現への検証を行なう..
87. 吉田 龍生, フォン ヤオカイ, 内田 誠一, カメラ・プロジェクタシステムを用いたタッチスクリーンの構築 (ヒューマン情報処理), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.358, pp.55-60, 2012.12, 本研究の目的は,プロジェクタから投影されたスクリーン上でタッチスクリーン操作を実現することである.その一つの手段として,スクリーンのタッチパネル化が考えられる.しかし,タッチパネルの大型化にはコスト面での課題が残る.そこで,カメラ・プロジェクタシステムを用いることを考える.カメラ・プロジェクタシステムとは,既存のプロジェクタシステムにカメラを備えつけ,そのカメラから得られる情報とプロジェクタの特性を活かし,構築するシステムである.本研究において,構築するシステムに用いるカメラは,web カメラ1 台と限定する.そうすることで,タッチパネルの大型化に残るコスト面での課題を克服することが可能である.カメラ・プロジェクタシステムによるタッチスクリーン操作の実現には,指領域の検出,スクリーンへの接触検知,トラッキングが必要となる.本稿では,まず指領域の検出及びスクリーンへの接触検知の方法について述べる.そして,トラッキングの手法を提示し,その手法による実験を行ない,タッチスクリーン実現への検証を行なう..
88. 白石 壮馬, フォン ヤオカイ, 内田 誠一, 特徴選択を伴う早期認識 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.357, pp.13-18, 2012.12.
89. 白石 壮馬, フォン ヤオカイ, 内田 誠一, 特徴選択を伴う早期認識 (パターン認識・メディア理解), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.357, pp.13-18, 2012.12, 早期認識とは,時系列パターンを終了前の任意の時刻で認識する方法である.早期認識は冒頭から認識時刻までの情報のみを用いて認識を行うという点で,全時刻の情報を利用可能な通常の時系列パターン認識とは異なる.パターンの終了以前の時刻で現れる,認識に有効な情報を効果的に利用することで早期認識は可能となる.早期認識の実現方法として,冒頭からの各時刻に識別器を用意しておき,早期認識を行う時刻で,それらを統合する方法が考えられる.これらの識別器はあらかじめ学習により準備しておく必要がある.各時刻の識別器を独立して学習するのではなく,相補的に働くように学習しておくことで,より有効な認識が可能となる.本稿ではこのような学習の過程において,各時刻でパターンから得られる特徴のうち,識別に有効な特徴を選択する方法を提案する.時系列パターンにおいて,各時刻で有効な特徴が刻々と変化するような場合,特徴選択により高精度で,高効率な早期認識が実現可能であると考えられる.また,提案方法により各時刻での特徴選択を観察することで,対象パターンの認識への理解が得られる点も有意義である..
90. 白石 壮馬, フォン ヤオカイ, 内田 誠一, 特徴選択を伴う早期認識 (ヒューマン情報処理), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.358, pp.13-18, 2012.12, 早期認識とは,時系列パターンを終了前の任意の時刻で認識する方法である.早期認識は冒頭から認識時刻までの情報のみを用いて認識を行うという点で,全時刻の情報を利用可能な通常の時系列パターン認識とは異なる.パターンの終了以前の時刻で現れる,認識に有効な情報を効果的に利用することで早期認識は可能となる.早期認識の実現方法として,冒頭からの各時刻に識別器を用意しておき,早期認識を行う時刻で,それらを統合する方法が考えられる.これらの識別器はあらかじめ学習により準備しておく必要がある.各時刻の識別器を独立して学習するのではなく,相補的に働くように学習しておくことで,より有効な認識が可能となる.本稿ではこのような学習の過程において,各時刻でパターンから得られる特徴のうち,識別に有効な特徴を選択する方法を提案する.時系列パターンにおいて,各時刻で有効な特徴が刻々と変化するような場合,特徴選択により高精度で,高効率な早期認識が実現可能であると考えられる.また,提案方法により各時刻での特徴選択を観察することで,対象パターンの認識への理解が得られる点も有意義である..
91. 稲井 浩平, フォン ヤオカイ, 内田 誠一, 文字の選択的隠蔽, 電子情報通信学会技術研究報告. EA, 応用音響, Vol.112, No.292, pp.123-128, 2012.11, 現在ウェブ上で,ナンバープレートのような文字による個人情報を含む画像が公開されており,プライバシー保護を行なわなければ,法的な問題を引き起こすことがある.そのため,自動で情景内の文字部分を検出し,検出部分に対して隠蔽処理を行なわなければならない.隠蔽の際,誤検出が存在することに配慮する必要がある.すなわち,例えば文字部分を難読化するために検出部分をぼかそうとすると,同時に誤検出部分もぼけてしまい画像に悪影響が生じてしまうことになる.そこで,本研究では,文字が独特の被隠蔽特性を持つことを利用し,文字の可読性が失われ,誤検出部分に対して与える悪影響が最低限になる隠蔽処理を考える.具体的には,テクスチャ合成法の一種であるimage inpaintingを用いた隠蔽法を提案する.本手法の効果を確認するために,ナンバープレート検出及び隠蔽実験を行ない,本手法の有効性を確認した..
92. 稲井 浩平, フォン ヤオカイ, 内田 誠一, 文字の選択的隠蔽 (マルチメディア情報ハイディング・エンリッチメント), 電子情報通信学会技術研究報告 : 信学技報, Vol.112, No.293, pp.123-128, 2012.11.
93. 稲井 浩平, フォン ヤオカイ, 内田 誠一, 文字の選択的隠蔽(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般), 電子情報通信学会技術研究報告. EA, 応用音響, Vol.112, No.292, pp.123-128, 2012.11, 現在ウェブ上で,ナンバープレートのような文字による個人情報を含む画像が公開されており,プライバシー保護を行なわなければ,法的な問題を引き起こすことがある.そのため,自動で情景内の文字部分を検出し,検出部分に対して隠蔽処理を行なわなければならない.隠蔽の際,誤検出が存在することに配慮する必要がある.すなわち,例えば文字部分を難読化するために検出部分をぼかそうとすると,同時に誤検出部分もぼけてしまい画像に悪影響が生じてしまうことになる.そこで,本研究では,文字が独特の被隠蔽特性を持つことを利用し,文字の可読性が失われ,誤検出部分に対して与える悪影響が最低限になる隠蔽処理を考える.具体的には,テクスチャ合成法の一種であるimage inpaintingを用いた隠蔽法を提案する.本手法の効果を確認するために,ナンバープレート検出及び隠蔽実験を行ない,本手法の有効性を確認した..
94. 稲井 浩平, フォン ヤオカイ, 内田 誠一, 文字の選択的隠蔽, 電子情報通信学会技術研究報告. EMM, マルチメディア情報ハイディング・エンリッチメント = IEICE technical report. EMM, Enriched multimedia, Vol.112, No.293, pp.123-128, 2012.11, 現在ウェブ上で,ナンバープレートのような文字による個人情報を含む画像が公開されており,プライバシー保護を行なわなければ,法的な問題を引き起こすことがある.そのため,自動で情景内の文字部分を検出し,検出部分に対して隠蔽処理を行なわなければならない.隠蔽の際,誤検出が存在することに配慮する必要がある.すなわち,例えば文字部分を難読化するために検出部分をぼかそうとすると,同時に誤検出部分もぼけてしまい画像に悪影響が生じてしまうことになる.そこで,本研究では,文字が独特の被隠蔽特性を持つことを利用し,文字の可読性が失われ,誤検出部分に対して与える悪影響が最低限になる隠蔽処理を考える.具体的には,テクスチャ合成法の一種であるimage inpaintingを用いた隠蔽法を提案する.本手法の効果を確認するために,ナンバープレート検出及び隠蔽実験を行ない,本手法の有効性を確認した..
95. 木村 崇志, 柿迫 良輔, フォン ヤオカイ, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, Reading-Life Logのプロトタイプ実装, 画像の認識・理解シンポジウム(MIRU2012), p.5, 2012.08,

人間が日々目で見て読んでいる文字を自動的に認識,記録できれば,極めて有用である.我々はこれを Reading-Life Log と呼び,人間の趣向や考えの把握,行動履歴の検索等への応用を考えている.実現のためには,視 線情報の抽出,視線位置の文字の切り出し,文字認識技術が必要となる.本研究では,視線位追跡デバイス(アイト ラッカ)とweb カメラを用いて視線情報を抽出し,視線位置の画像の切り出しを行う.そして,切り出した画像を OCR エンジンに入力し認識結果を得る.本稿では,そのプロトタイプの実装の様子と,その性能を評価するために 行った屋内,屋外などの様々な環境や条件下での認識実験結果について論ずる..
96. 青木 健太, 藤崎 顕彰, ヤオカイ フォン, 内田 誠一, 荒関 雅彦, 齋藤 有紀, 鈴木 利治, ライブセルイメージのための雑音除去, 電子情報通信学会技術研究報告. SP, 音声, Vol.111, No.431, pp.91-96, 2012.02, 顕微鏡およびイメージング技術の発達により,細胞内の様々な現象を動画像(ライブセルイメージ)として観察できるようになった.これらの画像は生命現象の根源を捉えたものであり,そこで起きている物質動態の観察や解析を行うことで様々な病気のメカニズムの解明が期待される.一方,ライブセルイメージに対する画像情報処理技術はまだまだ発展途上であり,物質動態の解析については生物学研究者の目視や手作業で行われている.このような負担を軽減するため,本稿では細胞内における物質動態解析の自動化を目標とし,その第一歩として蛍光観察されるタンパク質分子(APP-GFP)の自動検出を試みた..
97. 青木 健太, 藤崎 顕彰, フォン ヤオカイ, 内田 誠一, 荒関 雅彦, 齋藤 有紀, 鈴木 利治, ライブセルイメージのための雑音除去(一般セッション,時系列パターン認識), 電子情報通信学会技術研究報告. SP, 音声, Vol.111, No.431, pp.91-96, 2012.02, 顕微鏡およびイメージング技術の発達により,細胞内の様々な現象を動画像(ライブセルイメージ)として観察できるようになった.これらの画像は生命現象の根源を捉えたものであり,そこで起きている物質動態の観察や解析を行うことで様々な病気のメカニズムの解明が期待される.一方,ライブセルイメージに対する画像情報処理技術はまだまだ発展途上であり,物質動態の解析については生物学研究者の目視や手作業で行われている.このような負担を軽減するため,本稿では細胞内における物質動態解析の自動化を目標とし,その第一歩として蛍光観察されるタンパク質分子(APP-GFP)の自動検出を試みた..
98. 青木 健太, 藤崎 顕彰, フォン ヤオカイ, 内田 誠一, 荒関 雅彦, 齋藤 有紀, 鈴木 利治, ライブセルイメージのための雑音除去, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.430, pp.91-96, 2012.02, 顕微鏡およびイメージング技術の発達により,細胞内の様々な現象を動画像(ライブセルイメージ)として観察できるようになった.これらの画像は生命現象の根源を捉えたものであり,そこで起きている物質動態の観察や解析を行うことで様々な病気のメカニズムの解明が期待される.一方,ライブセルイメージに対する画像情報処理技術はまだまだ発展途上であり,物質動態の解析については生物学研究者の目視や手作業で行われている.このような負担を軽減するため,本稿では細胞内における物質動態解析の自動化を目標とし,その第一歩として蛍光観察されるタンパク質分子(APP-GFP)の自動検出を試みた..
99. 岩切 裕太郎, ヤオカイ フォン, 内田 誠一, 事例に基づく筆順推定, 電子情報通信学会技術研究報告. SP, 音声, Vol.111, No.431, pp.201-206, 2012.02, 本研究では,事例ベースの時系列推定ついて検討する.最も扱いやすい具体例として,手書き数字画像の筆順の推定を行う.すなわち,ある文字を筆記する途中の画像を事例として,大量に用意し,それらを用いて入力文字画像の筆記順序を推定する.文字は2値画像であるから,この際の推定処理は,入力文字画像から1つずつ黒画素を削る処理となる.どの黒画素を削除するかを事例を用いて決定する.実験結果により,およそ40%について推定が成功することがわかった..
100. 岩切 裕太郎, フォン ヤオカイ, 内田 誠一, 事例に基づく筆順推定(テーマセッション,時系列パターン認識), 電子情報通信学会技術研究報告. SP, 音声, Vol.111, No.431, pp.201-206, 2012.02, 本研究では,事例ベースの時系列推定ついて検討する.最も扱いやすい具体例として,手書き数字画像の筆順の推定を行う.すなわち,ある文字を筆記する途中の画像を事例として,大量に用意し,それらを用いて入力文字画像の筆記順序を推定する.文字は2値画像であるから,この際の推定処理は,入力文字画像から1つずつ黒画素を削る処理となる.どの黒画素を削除するかを事例を用いて決定する.実験結果により,およそ40%について推定が成功することがわかった..
101. 岩切 裕太郎, フォン ヤオカイ, 内田 誠一, 事例に基づく筆順推定, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.430, pp.201-206, 2012.02, 本研究では,事例ベースの時系列推定ついて検討する.最も扱いやすい具体例として,手書き数字画像の筆順の推定を行う.すなわち,ある文字を筆記する途中の画像を事例として,大量に用意し,それらを用いて入力文字画像の筆記順序を推定する.文字は2値画像であるから,この際の推定処理は,入力文字画像から1つずつ黒画素を削る処理となる.どの黒画素を削除するかを事例を用いて決定する.実験結果により,およそ40%について推定が成功することがわかった..
102. 藤崎 顕彰, 青木 健太, ヤオカイ フォン, 内田 誠一, 荒関 雅彦, 齋藤 有紀, 鈴木 利治, 大局的最適化による細胞内粒子の追跡, 電子情報通信学会技術研究報告. SP, 音声, Vol.111, No.431, pp.207-212, 2012.02, 蛍光顕微鏡により撮影されたノイズが多く,カラー情報もない細胞内動画像について,その細胞内を移動する粒子の追跡を試みる.細胞内動画像中には形状がほぼ同じ粒子が複数同時に存在するため,パーティクルフィルタのようなオンライン追跡を適用するのは困難である.そこで,より頑健な追跡手法として複数経路を同時に大局的最適化する手法を提案する.この手法は,組み合わせ最適化問題で言うところの多次元マッチング問題の解法であり,従って指数オーダーの計算量を要する.こうした計算量的困難性を極力緩和して効率的に大局的最適解を求めるべく,本稿では動的計画法に基づく方法-多次元キューブサーチ法-を提案する.実験の結果,人間の目視に非常に近い追跡精度が得られることがわかり,動態解析自動化の実用的可能性が確認された..
103. 藤崎 顕彰, 青木 健太, フォン ヤオカイ, 内田 誠一, 荒関 雅彦, 齋藤 有紀, 鈴木 利治, 大局的最適化による細胞内粒子の追跡(テーマセッション,時系列パターン認識), 電子情報通信学会技術研究報告. SP, 音声, Vol.111, No.431, pp.207-212, 2012.02, 蛍光顕微鏡により撮影されたノイズが多く,カラー情報もない細胞内動画像について,その細胞内を移動する粒子の追跡を試みる.細胞内動画像中には形状がほぼ同じ粒子が複数同時に存在するため,パーティクルフィルタのようなオンライン追跡を適用するのは困難である.そこで,より頑健な追跡手法として複数経路を同時に大局的最適化する手法を提案する.この手法は,組み合わせ最適化問題で言うところの多次元マッチング問題の解法であり,従って指数オーダーの計算量を要する.こうした計算量的困難性を極力緩和して効率的に大局的最適解を求めるべく,本稿では動的計画法に基づく方法-多次元キューブサーチ法-を提案する.実験の結果,人間の目視に非常に近い追跡精度が得られることがわかり,動態解析自動化の実用的可能性が確認された..
104. 藤崎 顕彰, 青木 健太, フォン ヤオカイ, 内田 誠一, 荒関 雅彦, 齋藤 有紀, 鈴木 利治, 大局的最適化による細胞内粒子の追跡, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.430, pp.207-212, 2012.02, 蛍光顕微鏡により撮影されたノイズが多く,カラー情報もない細胞内動画像について,その細胞内を移動する粒子の追跡を試みる.細胞内動画像中には形状がほぼ同じ粒子が複数同時に存在するため,パーティクルフィルタのようなオンライン追跡を適用するのは困難である.そこで,より頑健な追跡手法として複数経路を同時に大局的最適化する手法を提案する.この手法は,組み合わせ最適化問題で言うところの多次元マッチング問題の解法であり,従って指数オーダーの計算量を要する.こうした計算量的困難性を極力緩和して効率的に大局的最適解を求めるべく,本稿では動的計画法に基づく方法-多次元キューブサーチ法-を提案する.実験の結果,人間の目視に非常に近い追跡精度が得られることがわかり,動態解析自動化の実用的可能性が確認された..
105. 島田 祐輝, ヤオカイ フォン, 内田 誠一, 局所特徴を用いた細胞画像認識, 電子情報通信学会技術研究報告. SP, 音声, Vol.111, No.431, pp.231-236, 2012.02.
106. 島田 祐輝, フォン ヤオカイ, 内田 誠一, 局所特徴を用いた細胞画像認識(一般セッション,時系列パターン認識), 電子情報通信学会技術研究報告. SP, 音声, Vol.111, No.431, pp.231-236, 2012.02, 細胞のイメージング技術の著しい向上が見られる一方で,得られた画像の解析が生物学者の目視に依るという現状がある.目視解析の結果は観察者の主観によるものであり,観察できる試料の量にも限界がある.近年ではこういうた背景より,顕微鏡による細胞画像の観察から,コンピュータによって細胞画像から定量的データを得る,バイオイメージインフォマティクスという研究分野が盛んになってきている.今回,そのターゲットとして,細胞画像の認識問題を採り上げる.細胞画像は,その柔軟性から複雑な形状・テクスチャを有しており,結果的にその認識問題は難易度の高いものとなる.本稿では,それらの細胞画像に対してテクスチャ特徴を用いたpart-basedアプローチによる認識を試みる.すなわち,柔軟性のある対象に対して柔軟性のあるアプローチをもって認識を試みる.本稿は,これらの複雑形状を持つ細胞画像に対してテクスチャ特徴によるpart-basedアプローチの有効性を示す.加えて,テクスチャ特徴の特徴空間中の広がりについて考察を行う..
107. 島田 祐輝, フォン ヤオカイ, 内田 誠一, 局所特徴を用いた細胞画像認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.430, pp.231-236, 2012.02, 細胞のイメージング技術の著しい向上が見られる一方で,得られた画像の解析が生物学者の目視に依るという現状がある.目視解析の結果は観察者の主観によるものであり,観察できる試料の量にも限界がある.近年ではこういうた背景より,顕微鏡による細胞画像の観察から,コンピュータによって細胞画像から定量的データを得る,バイオイメージインフォマティクスという研究分野が盛んになってきている.今回,そのターゲットとして,細胞画像の認識問題を採り上げる.細胞画像は,その柔軟性から複雑な形状・テクスチャを有しており,結果的にその認識問題は難易度の高いものとなる.本稿では,それらの細胞画像に対してテクスチャ特徴を用いたpart-basedアプローチによる認識を試みる.すなわち,柔軟性のある対象に対して柔軟性のあるアプローチをもって認識を試みる.本稿は,これらの複雑形状を持つ細胞画像に対してテクスチャ特徴によるpart-basedアプローチの有効性を示す.加えて,テクスチャ特徴の特徴空間中の広がりについて考察を行う..
108. 古澤 雄大, 今西 将, 平田 真吾, 内田 誠一, 中野 幸二, 林 健司, 匂いイメージングセンサ用匂い検知フィルムの開発, 電気学会研究会資料. MBE, 医用・生体工学研究会, Vol.2012, No.2, pp.13-18, 2012.01.
109. 古澤 雄大, 今西 将, 平田 真吾, 内田 誠一, 中野 幸二, 林 健司, 匂いイメージングセンサ用匂い検知フィルムの開発, 電子情報通信学会技術研究報告. MBE, MEとバイオサイバネティックス, Vol.111, No.423, pp.13-18, 2012.01.
110. 古澤 雄大, 今西 将, 平田 真吾, 内田 誠一, 中野 幸二, 林 健司, 匂いイメージングセンサ用匂い検知フィルムの開発 (MEとバイオサイバネティックス), 電子情報通信学会技術研究報告 : 信学技報, Vol.111, No.423, pp.13-18, 2012.01, 近年,悪臭公害やガス爆発,中毒などの問題解決のため,匂いの質や量を客観的に評価できる方法が求められている.また,それらの有害な匂いを検知して追跡し,その源の特定を行い根本から除去する必要がある.本研究では,蛍光色素をプローブとした匂い検出を試みた.まず,溶液系における蛍光分析を行ったところ,蛍光分子と匂い分子の相互作用による蛍光変化から匂いの検出が可能であった.次に,匂いガスの検出を行うため,蛍光色素をシート状にした匂い検知フィルムを開発し,CCDカメラによる画像撮影を用いた検出系の研究を行った.この研究により,匂いガスの検知が可能となり,また匂いの形状や匂いの広がり,濃度分布の検知も可能とした..
111. 木村 崇志, フォン ヤオカイ, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, Reading-Lifelog の実現に向けた予備的検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.317, pp.51-56, 2011.11, 人間が日々目で見て読んでいる文字を自動的に認識,記録できれば,極めて有用である.我々はこれをReading-Lifelogと呼び,人間行動履歴の検索等への応用を考えている.実現のためには,視線情報の抽出,視線位置の文字の切り出し,文字認識技術が必要となる.本研究では,アイトラッカとwebカメラを用いて視線情報の抽出し,視線位置の画像の切り出しを行う.そして,切り出した画像をOCRエンジンに入力し認識結果を得る.本稿では,以上のシステムで屋内,屋外などの様々な環境や条件下で実験を行い,Reading-Lifelog実現に向けた検証を行う..
112. 松尾 崇史, フォン ヤオカイ, 内田 誠一, part-based オンライン文字認識の試み, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.317, pp.1-6, 2011.11, オンライン文字認識では,文字のストローク全体を一括して辞書パターンとマッチングさせる手法が主として用いられる.これに対して本稿では,文字ストロークを小区間に分割した局所部分単位での文字認識を試みる.ストロークの小区間とは,短く単純な形状を持った直線や曲線である.従って,ストローク全体を一括して用いる方法に比べ,著しく少ないクラス情報に基づいて認R処理が行われることになる.要するに,「/」や「|」といった形状だけを見て,それがどのクラスに属するかを当てる処理であり,非常に困難であると思われる.しかしながら,手書き数字10クラスを対象とした実験の結果,文字面積の約40%の局所領域サイズにより,80%程度の文字認識率を得ることができた..
113. 近野 恵, 黄瀬 浩一, 岩村 雅一, 内田 誠一, 大町 真一郎, カメラペンシステムにおける筆跡復元精度の向上, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.317, pp.13-18, 2011.11, 本稿では,我々が開発中のカメラペンシステムにおける筆跡の復元精度向上法を提案する.カメラペンシステムとは,カメラを取り付けたペンを用いて紙面に筆記した文字や図等を,筆跡そのままにデジタルデータ化するシステムである.このシステムは,筆跡を求める処理と,その筆跡の文書上の位置を求める処理から成り立っており,前者にはSURFトラッキング後者は文書画像検索法を用いる.ここで,復元した筆跡にずれや欠損が含まれる等,復元精度が低いことが問題となっている.この主な原因は,SURFトラッキングの精度が低いことである.この問題を解決するために,LKトラッキングを利用する.効果を検証するため,SURFトラッキングを用いた従来手法と,LKトラッキングを用いた提案手法の比較実験を行った結果,従来手法に比べ精度の向上が見られた..
114. 大場 慎平, フォン ヤオカイ, 内田 誠一, 多重仮説に基づいた情景画像中文字認識の検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.317, pp.45-50, 2011.11, 情景画像内における文字認識とは,カメラ等で撮影された環境画像中に存在する文字を検出し理解する処理のことである.文字検出における従来手法では,文字の持つ特徴を利用することで文字領域の特定を行うものが一般的であった.しかし,環境中に存在する文字は,非常に多種多様であり,その多様性が単一手法による文字検出・認識を難解なものとしている.そこで本論文ではそのような文字の多様性に対して,検出・認識手法の多様性をもって対処することを考える.具体的には,多重仮説という概念を取り入れ,複数の認識結果を得て,それらを多数決により統合する.実験により,単一手法のみのでは処理できない部分にも対処していることで提案手法の効果を確認した..
115. 森 稔, 内田 誠一, 坂野 鋭, 大局的構造情報を用いたオンライン数字認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.317, pp.19-24, 2011.11, 本稿では,文字認識における文字の大局的構造情報の重要性について議論する.ストロークから抽出される特徴を用いた多くの文字認識技術では,ストロークを離散化して得られた各点のxy座標値や局所的な方向情報の組や時系列を,局所的特徴として用いる.ストロークは局所情報の系列としての軌跡である為,これらの特徴を用いるのは自然な発想である.しかし,局所的特徴により文字の大局的な構造や成立過程を直接表現することは,明らかに不可能である.例えば,局所特徴の時系列では,クラス"0"における開始点と終点が近接した位置に存在するという情報を,直接表現できない.本稿では,各クラスの字形における大局的な構造を表現する大局的特徴を提案する.局所的特徴を含めた特徴選択を用いた実験により,大局的特徴の重要性を検証する.特にAdaBoostを用いた特徴選択の枠組みにおいて,認識精度の向上に対し,局所的特徴より大局的特徴の方がより多く選択されることを述べる.また,オンライン数字データを用いた認識実験において,大局的特徴を用いることで認識精度が向上することを述べる..
116. 吉田 晃, 蔡 文傑, フォン ヤオカイ, 内田 誠一, 大規模手書き文字認識 : 欠損部補完に見る文字パターン分布, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.317, pp.99-104, 2011.11, 本研究の目的は,パターン空間における分布の様子を明らかにすることである.本稿では,822,714個の手書き数字パターンを用い,欠損文字補完を通してパターン分布の解明に取り組んだ.具体的には,学習パターン数を変化させた場合の補完形状や補完精度の変化等,定性的・定量的の両側面から観察を行なった..
117. 石田 良介, 吉田 晃, 蔡 文傑, フォン ヤオカイ, 内田 誠一, 大規模手書き文字認識 : ネットワーク解析に見る文字パターン分布, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.317, pp.105-110, 2011.11, ここ数年の計算機の著しい性能向上によって,大量のデータを用いた認識が行われるようになった.しかし,パターンの分布については未だに明らかになっていない部分が多い.そこで本研究では,約80万個の画像を登録した大規模データベースを用いて「パターンの真の分布解明」を目指す.本稿では,パターンの近傍関係から作成した最小全域木を用いてパターン分布の構造解析を行った.そして,パターンがクラスごとに広い領域を形成していることがわかった.また,クラスの隣接関係や,パターンの増加に伴うパターン空間の状況の変化を検証した..
118. 白石 壮馬, フォン ヤオカイ, 内田 誠一, 局所特徴に基づくスキュー補正, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.317, pp.63-68, 2011.11, 既存のOCRシステムには,画像中のテキストにスキューが存在すると,適切な認識結果が得られないという問題点が存在する.本稿では画像中のテキストスキューを補正する新たな手法を提案する.これは文字の局所部分を用いる事例ベースの手法である.本手法では,まず,訓練データである直立文字画像から局所特徴を抽出し,その情報を輝度勾配角度情報と共に事例として保持しておく.スキュー補正を行う際には,対象となる画像に対し同様の局所特徴抽出を行う.そして,それぞれの抽出特徴に対し,最近傍となる事例を探索し,輝度勾配角度の差を計算することで,画像中の部分ごとの局所スキュー角を推定する.最後に,得られた全ての局所推定の中から,多数決によりテキスト全体のスキュー角を決定する.従来手法に存在した,文字が画像中で直線状に列を形成していなければならないという制限を,本手法では取り除くことに成功した.さらに,本手法は,従来手法では不可欠だった連結成分の抽出や文字領域の特定といった画像の前処理を必要としないという利点がある.実験では,従来手法との比較を用いながら,本手法の有効性を示した..
119. 外堀 悟士, フォン ヤオカイ, 内田 誠一, 手書き文字を対象とした解析的2次元DPマッチングの動作解析, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.111, No.317, pp.81-86, 2011.11, 2次元弾性マッチングとは,2つの画像間をマッチングする際に一方をゴムのように伸縮させマッチングを行う手法である.2次元弾性マッチングを用いることにより,手書き文字における人間の筆跡の違いや文字の大きさといった差異に柔軟に対応することができる.解析的2次元DPマッチングは,離散的DPマッチングの局所距離を2次関数近似することで解析的な解法を適用可能としたもので,2次元弾性マッチングの中でも柔軟性と高速性を両立させた手法に位置付けられる.本研究では,異なる2次関数近似方法の比較および従来の弾性マッチング手法との比較を行うことで本手法の動作解析を行う..
120. 木村 崇志, ヤオカイ フォン, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 視線情報を用いた文字認識, 電気関係学会九州支部第64回連合大会, 2011.09.
121. 川野裕希, フォンヤオカイ, 内田誠一, 多峰型解析的DPトラッキング, 画像の認識・理解シンポジウム(MIRU2011)論文集, Vol.2011, No.2011, pp.448-455, 2011.07.
122. 佐々木徹, フォンヤオカイ, 内田誠一, 座標軸の回転を許容した非同期DPマッチングに基づく手書き文字変形モデルの実験的検証, 画像の認識・理解シンポジウム(MIRU2011)論文集, Vol.2011, No.2011, pp.1248-1255, 2011.07.
123. 稲井浩平, 大場慎平, フォンヤオカイ, 内田誠一, 情景画像中の文字の隠蔽に関する試み, 画像の認識・理解シンポジウム(MIRU2011)論文集, Vol.2011, No.2011, pp.97-104, 2011.07.
124. 福冨正弘, 小川原光一, フォンヤオカイ, 内田誠一, 非マルコフ的制約を導入した最適弾性マッチング, 画像の認識・理解シンポジウム(MIRU2011)論文集, Vol.2011, No.2011, pp.2-9, 2011.07.
125. 小田 幸弘, 廣瀬 信之, 内田 誠一, 森 周司, ゴールキーパーがペナルティキックを止めるには : DPマッチングを用いたキッカーの動作解析, 電子情報通信学会技術研究報告. HCS, ヒューマンコミュニケーション基礎, Vol.111, No.59, pp.121-125, 2011.05, サッカーのペナルティキック時のゴールキーパーは,キッカーのボールを蹴る動作の違いに基づいて,シュートのコースを予測していると考えられている.本研究では,GKがPK動作中のどの時点,どの身体部位の情報をコースの予測に使用しているか調べるために,PKを想定したキッカーの動作をDPマッチングにより解析した.解析の結果,ボールを蹴る直前の軸足,腰などの動きがコースによって異なることが分かった..
126. 小田 幸弘, 廣瀬 信之, 内田 誠一, 森 周司, ゴールキーパーがペナルティキックを止めるには : DPマッチングを用いたキッカーの動作解析, 電子情報通信学会技術研究報告. HIP, ヒューマン情報処理, Vol.111, No.60, pp.121-125, 2011.05, サッカーのペナルティキック時のゴールキーパーは,キッカーのボールを蹴る動作の違いに基づいて,シュートのコースを予測していると考えられている.本研究では,GKがPK動作中のどの時点,どの身体部位の情報をコースの予測に使用しているか調べるために,PKを想定したキッカーの動作をDPマッチングにより解析した.解析の結果,ボールを蹴る直前の軸足,腰などの動きがコースによって異なることが分かった..
127. 内田 誠一, Liwicki Marcus, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 情報埋め込みペンによる手書き価値の向上, 電子情報通信学会技術研究報告. EMM, マルチメディア情報ハイディング・エンリッチメント = IEICE technical report. EMM, Enriched multimedia, Vol.111, No.74, pp.17-22, 2011.05, 手書きは,人類のコミュニケーション手段として古来から広く利用されている.そして現代,タブレットやアノトペンといった技術進歩により,計算機への入力手段としても手書きは普遍的なものとなった.しかし,日常的な「紙の上の手書き」は,依然「紙の上の手書き」のままであり,それ以上の価値を持つに至っていない.これに対し,筆者らによるユニバーサルパターンプロジェクトでは,「情報埋め込みペン」を開発した.これは,情報埋め込み技術により,手書きに新たな価値を付与しようという試みである.このペンでは,ペン先のインクジェットにより,筆記時にリアルタイムに筆記者情報や筆記日時などの任意情報を埋め込むことができる.埋め込んだ情報は画像処理により復元できる.すなわち,紙の上の手書きに,計算機可読な様々な情報を埋め込むことができる.実験により,5cmの筆記に32ビット程度の情報を誤りなく埋め込めることを確認している..
128. 斎藤 宙也, 菅谷 至寛, 大町 真一郎, 内田 誠一, 岩村 雅一, 黄瀬 浩一, サンプル文字画像からの文字パターンの合成, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.467, pp.293-298, 2011.03, 用途・目的に応じて,さまざまな文字フォントが使用されている.しかし,フォントを制作する作業は多大な労力を要する.そこで,本論文では特定の特徴を持ったフォントを自動合成する技術を提案する.提案手法では画像を小さいパッチに分割し,並べ替えることで画像に任意の変更を加えるPatch Transformと,その並べ替えの指針の一つとして画像の形状情報を表すShape Contextを組み合わせた手法を用いる.実験の結果,サンプルの特徴を保持した文字画像の合成において一定の成果を得た..
129. 佐々木 徹, フォン ヤオカイ, 内田 誠一, 回転を許容した非同期DPマッチングによるオンライン文字認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.467, pp.37-42, 2011.03, 本論文では,オンライン文字認識における文字変形モデルが,特徴量の非同期化並びに局所回転の組み合わせという単純な機構により実現できることを示す.オンライン文字認識などにおける時系列パターンマッチングでは,各パターンを例えばx-y座標を特徴ベクトルとした時系列として表現する.これらの特徴ベクトルは弾性マッチングによって時間軸方向の非線形伸縮を行いながらマッチングされる.その際特徴ベクトルの各時期の要素は必ず同期的に扱われる.これに対し,あえて特徴ベクトルの各要素を非同期的な時間軸の非線形伸縮を許容してマッチングを行う非同期DPマッチングの手法がある.ところがこの手法にも個別のパターンにおいて非同期化の効果に差異が生じる場合がある.その対処法として,本論文では各時期においてx-y軸の回転を行いながらマッチングを行う手法を提案する..
130. 池田 千廣, フォン ヤオカイ, 内田 誠一, 学習による映像中の一般音源同定, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.467, pp.67-72, 2011.03, 本稿は,映像中の一般音源同定を目的としている.一般音源同定とは,音源となり得る物体が複数カテゴリ想定される場合の音源同定問題を示す.本稿では,一般音源同定問題をAdaBoostを用いた識別器学習の枠組みで扱う.音源となり得る物体が複数カテゴリ存在するため,学習には,音特徴に加え,一般物体認識に有効とされる複数の画像特徴を用いる.まず,その画像特徴と音特徴を独立に扱いながら,識別器学習を試みる.その場合,音源同定問題独特の性質として,画像特徴と音特徴が与えられても音特徴がほとんど識別に寄与しないことが確認される.次にその解決法として,画像-音の相関特徴を識別器の学習に追加する.これにより,原理的に,音特徴が初めて有効に活用される.この事実を認識実験を行い,吟味した..
131. 重吉 佑樹, 國重 康弘, フォン ヤオカイ, 内田 誠一, 局所特徴を用いた文字検出の試み, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.467, pp.217-222, 2011.03, 情景内文字検出という困難な課題に対する,「局所特徴」および「顕著性マップ」の可能性を探る.SIFTやSURFに代表される局所特徴は,物体認識において様々に使われている.一方,文字の検出や認識において使われた例は少ない.ところが,それら局所特徴によって記述される画像特徴は,文字認識の定番である局所方向特徴と類似している.従って,文字の検出・認識に対しても適している可能性がある.これとは逆に,文字の検出は,文字と非文字という,明確な定義の難しいパターン群を対象とした困難な識別問題であり,結局のところ方向しか見ていない局所特徴では到底不可能とも考えられる.そこで実際の能力を測るべく,実際にSURF特徴を使って情景内文字検出実験を試みた.その結果,こうした単純な局所特徴によっても67~78%程度の文字・非文字識別が可能であることがわかった.また文字が一般に顕著にデザインされているという仮説に基づき,顕著性マップによる特徴を併用した場合の効果も検証した..
132. 國重 康弘, フォン ヤオカイ, 内田 誠一, 環境コンテキストによる情景内文字検出の高精度化, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.467, pp.281-286, 2011.03, 情景内文字検出とは,デジタルカメラ等で撮影された画像中の文字領域を特定する処理である.文字検出における従来のアプローチとは,エッジ特徴や空間周波数特性といった文字の形状に着目した手法が一般的であった.しかし,文字の形状は多種多様であり,環境中には文字の形状をしたエッジも多くみられるため,形状に関する特徴のみでは精度向上に限界があると考えられる.そこで,本論文では,文字の形状だけではなく,文字が存在している環境に着目するといった,環境コンテキストを利用した文字検出手法を提案する.実験により,環境コンテキスト情報を利用することによって,文字検出の精度が向上することを確認した..
133. 千々和 祐貴, フォン ヤオカイ, 内田 誠一, 複数人物の無矛盾な位置同定における時系列処理の導入, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.467, pp.211-216, 2011.03, 環境カメラから得られる大局的観測と人物に装着したカメラによる局所的観測を統合することで,複数人物の各々の位置を同定する手法を提案する.具体的には,大局的観測から得られる複数の人物位置の各々について,それがどの局所的観測とマッチングするかを判定する.著者らはこれまで,重み付き2部グラフマッチングとして定式化した手法を提案してきた.すなわち,マッチング判定を行う際,各フレーム独立に人物位置と局所的観測との1対1対応を行うことで,精度向上を確認することができた.本稿では,さらなる精度向上を図るために,動的計画法による時系列処理を導入した手法を提案する.また,手法の原理を説明すると共に,手法の精度評価を目的とした位置同定の実験結果を報告する..
134. 福冨 正弘, 小川原 光一, フォン ヤオカイ, 内田 誠一, 非マルコフ的弾性マッチング, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.467, pp.189-194, 2011.03, 本稿では,時間的非線形伸縮を伴う時系列パターンの弾性マッチングを,グラフの最小切断(グラフカット)アルゴリズムにより求める手法について検討する.一般に,パターンの弾性マッチングには,DPやHMM等が用いられる.これら従来手法では,マッチングの際,単純マルコフ性を満たす制約しか導入できない.一方,本手法では,DPにおけるマッチングをグラフ上で表現し,それをグラフカットアルゴリズムにより解くことで,非マルコフ的制約も導入可能となる.本手法の有効性を,オンライン文字データを対象とした認識実験を行い検証する..
135. 松尾 洋孝, 今西 将, 内田 誠一, 林 健司, 蛍光を用いた匂い可視化センシング, 電気学会研究会資料. MBE, 医用・生体工学研究会, Vol.2011, No.1, pp.33-38, 2011.01.
136. 松尾 洋孝, 今西 将, 内田 誠一, 林 健司, 蛍光を用いた匂い可視化センシング, 電子情報通信学会技術研究報告. MBE, MEとバイオサイバネティックス, Vol.110, No.399, pp.33-38, 2011.01, 匂いを辿るということは様々なメリットがある.例えば,匂いを追跡しその源を特定することにより不快な匂いを根本から除去することが可能となる.特に,ロボティクスなどの分野ではその応用が期待されている.本研究では,蛍光色素をプローブとして用いて匂い検出を試みた.まず,水溶液系での基礎的な実験を行ったところ,蛍光分子と匂い分子の相互作用による蛍光変化から匂いの検出が可能であった.次に,蛍光色素をシート状に配置し,冷却型CCDカメラによる画像撮影を用いた気体の匂いガスの新しい検出手法について研究を行った.この匂い検出手法により匂いの形状や濃度勾配をもとに匂いの流れを検出することが可能とであった..
137. 青木 健太, フォン ヤオカイ, 内田 誠一, 荒関 雅彦, 齋藤 有紀, 鈴木 利治, 学習による細胞内粒状物質の検出, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.330, pp.7-12, 2010.12, 顕微鏡および各種蛍光技術の発達により,細胞内の各種物質の動き(細胞内ロジスティクス)を観察できるようになった.細胞は生命現象の根源であるから,物質動態を観察することで,各種疾病のメカニズムが解明できると期待される.現在,動きの解析・定量化作業は肉眼で行われているため,十分信頼のおけるデータを求めるために,生物系研究者は大変な労力を費やしている.そこで本稿では,細胞内の物質の動態解析自動化の第一歩として,蛍光観察される物質(APP-GFP)の自動検出を試みる.この自動検出は,実は画像処理としても非常に困難でチャレンジングな課題である.なぜならほぼ同一の見えを持つ粒状物体が大量に,ランダム性を伴って,そしてさらにオクルージョンを起こしながら移動するからである.従って単純な画像処理では限界があると思われる.そこで我々は,学習技術を用いて本課題に取り組む.具体的には,背景雑音除去のための前処理を施した画像に対し,各画素における背景と粒状物体との2クラス分類を試みる.分類手法としては機械学習の一手法であるSVM(Support Vector Machine)を用いる..
138. 吉田 晃, 蔡 文傑, フォン ヤオカイ, 内田 誠一, 手書き数字認識におけるデータベースの大規模化の効果, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.330, pp.119-124, 2010.12, 最近傍法はパターン認識の最も素朴な手法である.大量のパターンがWeb等を介して入手可能になり,計算機の能力も格段に向上した昨今,事例に基づいた極めて強力なパターン認識手法として見直されている.究極にはパターン空間をすべて埋め尽くすほどの事例を準備できれば,最近傍法により完全な認識が可能である.無論,この理想形は実現不可能であるが,文字パターンであれば極めて低次元で表現可能であり,一般的な画像に比べると肉薄しやすい.実際,無意味パターンも含めて全空間を埋め尽くさなくても,各カテゴリとして意味のあるパターンすべてが得らればそれで十分であることを考えれば,カテゴリが比較的明確な文字は有利である.また認識率を追求するだけでなく,実際のパターン分布の様子を観察するためにも,低次元でカテゴリが明確な文字は有利である.本稿では,830,000個を超える手書き数字パターンを登録したデータべースを用い,学習パターン数が最近傍認識に与える影響について検証を行なう.結果として,学習パターン数が10倍に増加すると,誤認識率が40%程度低下するという興味深い関係がみられた.また,学習パターンが増加した際のパターン空間の状況を,実験を通して検証した..
139. 千々和 祐貴, フォン ヤオカイ, 内田 誠一, 大局的観測と局所的観測の統合による複数人物の無矛盾な位置同定 (コンピュータビジョンとイメージメディア(CVIM)) -- (テーマセッション), 情報処理学会研究報告, Vol.2010, No.3, p.6p, 2010.10.
140. 池田 千廣, フォン ヤオカイ, 内田 誠一, 学習による映像中の音源同定 (コンピュータビジョンとイメージメディア(CVIM)) -- (テーマセッション), 情報処理学会研究報告, Vol.2010, No.3, p.6p, 2010.10.
141. 川野 裕希, 藤村 一行, フォン ヤオカイ, 内田 誠一, H-031 多峰型解析的DPを用いた動画像中の物体追跡(H分野:画像認識・メディア理解,一般論文), 情報科学技術フォーラム講演論文集, Vol.9, No.3, pp.199-200, 2010.08.
142. 福冨 正弘, 小川原 光一, フォン ヤオカイ, 内田 誠一, 多数決型アルゴリズムによる非線形伸縮時系列パターン認識, 電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 = IEICE technical report. IBISML, Information-based induction sciences and machine learning, Vol.110, No.188, pp.157-164, 2010.08, 本稿では,時間的非線形伸縮を伴う時系列パターンの認識手法を提案する.本手法では,入力パターンの各サンプル点(各時刻)にクラスラべルを割り当てる.同時に,時間的非線形伸縮に対応するため,各サンプル点に標準パターン上において対応するサンプル点を割り当てる.入力パターンのクラスは,最終的に,クラスラべル数の多数決により確定される.割り当てに際し,入力パターンの時間的に隣接するサンプル点同士に相互制約を設け,できるだけ同じクラスにラべリングすると同時に,標準パターンのできるだけ時間的に隣接したサンプル点に対応付ける.本稿では,将来的な非隣接サンプル点間制約の導入をにらんで,グラフの最小切断(グラフカット)の一種であるα拡張アルゴリズムによりこの最適割り当て問題を解く.このアルゴリズムは多項式時間計算量で済む半面,原問題の近似解法となっている.そこで,求まる近似解がどの程度妥当かについて,オンライン文字データを対象とした認識実験を行い検証する..
143. 福冨 正弘, 小川原 光一, フォン ヤオカイ, 内田 誠一, 多数決型アルゴリズムによる非線形伸縮時系列パターン認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.187, pp.157-164, 2010.08, 本稿では,時間的非線形伸縮を伴う時系列パターンの認識手法を提案する.本手法では,入力パターンの各サンプル点(各時刻)にクラスラベルを割り当てる.同時に,時間的非線形伸縮に対応するため,各サンプル点に標準パターン上において対応するサンプル点を割り当てる.入力パターンのクラスは,最終的に,クラスラベル数の多数決により確定される.割り当てに際し,入力パターンの時間的に隣接するサンプル点同士に相互制約を設け,できるだけ同じクラスにラベリングすると同時に,標準パターンのできるだけ時間的に隣接したサンプル点に対応付ける.本稿では,将来的な非隣接サンプル点間制約の導入をにらんで,グラフの最小切断(グラフカット)の一種であるα拡張アルゴリズムによりこの最適割り当て問題を解く.このアルゴリズムは多項式時間計算量で済む半面,原問題の近似解法となっている.そこで,求まる近似解がどの程度妥当かについて,オンライン文字データを対象とした認識実験を行い検証する..
144. 千々和 祐貴, フォン ヤオカイ, 内田 誠一, 大局的観測と局所的観測の統合による複数人物の無矛盾な位置同定, 電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 = IEICE technical report. IBISML, Information-based induction sciences and machine learning, Vol.110, No.188, pp.173-178, 2010.08, 大局的観測と人物に装着したカメラによる局所的観測を統合することで,複数人物の各々の位置を同定する手法を提案する.具体的には,大局的観測から得られる複数の人物位置の各々について,それがどの局所的観測とマッチングするかを判定する.大局的観測と局所的観測のマッチングを無矛盾すなわち1対1にするために,重み付き2部グラフマッチング問題として定式化する.本論文では,手法の原理を説明すると共に,手法の精度評価を目的とした位置同定の実験結果を報告する..
145. 千々和 祐貴, フォン ヤオカイ, 内田 誠一, 大局的観測と局所的観測の統合による複数人物の無矛盾な位置同定, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.187, pp.173-178, 2010.08, 大局的観測と人物に装着したカメラによる局所的観測を統合することで,複数人物の各々の位置を同定する手法を提案する.具体的には,大局的観測から得られる複数の人物位置の各々について,それがどの局所的観測とマッチングするかを判定する.大局的観測と局所的観測のマッチングを無矛盾すなわち1対1にするために,重み付き2部グラフマッチング問題として定式化する.本論文では,手法の原理を説明すると共に,手法の精度評価を目的とした位置同定の実験結果を報告する..
146. 池田 千廣, フォン ヤオカイ, 内田 誠一, 学習による映像中の音源同定, 電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 = IEICE technical report. IBISML, Information-based induction sciences and machine learning, Vol.110, No.188, pp.93-98, 2010.08, 本論文では,対象を絞った上でより高精度な画像と音の統合解析処理を目的としている.具体的には音源同定問題をAdaBoostを用いた識別器学習の枠組みで扱う.ここで,AdaBoost識別器とは複数個の識別器(弱識別器と呼ばれる)による識別結果の重み付多数決によって認識結果を得る方法である.学習においては,正例(映像中の音源に相当する画素)・負例(同じく非音源に相当する画素)を準備し,それを用いてAdaBoostにより誤認識率が最も低くなるように弱識別器を構成する.こうして得られた弱識別器の識別結果の重み付多数決によって音源が同定される.画像による弱識別器と音情報による弱識別器を組み合わせることで,高精度な音源同定が可能となる.ただし,音源同定独特の性質として,音と画像というマルチモーダルな情報が与えられたとしても,利用の仕方によっては,音情報がほとんど識別に寄与しなくなることがある.本稿ではこの状況について確認するとともに,その状況の解決法について提案する..
147. 池田 千廣, フォン ヤオカイ, 内田 誠一, 学習による映像中の音源同定, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.187, pp.93-98, 2010.08, 本論文では,対象を絞った上でより高精度な画像と音の統合解析処理を目的としている.具体的には音源同定問題をAdaBoostを用いた識別器学習の枠組みで扱う.ここで,AdaBoost識別器とは複数個の識別器(弱識別器と呼ばれる)による識別結果の重み付多数決によって認識結果を得る方法である.学習においては,正例(映像中の音源に相当する画素)・負例(同じく非音源に相当する画素)を準備し,それを用いてAdaBoostにより誤認識率が最も低くなるように弱識別器を構成する.こうして得られた弱識別器の識別結果の重み付多数決によって音源が同定される.画像による弱識別器と音情報による弱識別器を組み合わせることで,高精度な音源同定が可能となる.ただし,音源同定独特の性質として,音と画像というマルチモーダルな情報が与えられたとしても,利用の仕方によっては,音情報がほとんど識別に寄与しなくなることがある.本稿ではこの状況について確認するとともに,その状況の解決法について提案する..
148. 川野 裕希, 藤村 一行, フォン ヤオカイ, 内田 誠一, 離散型DPと解析的DPの統合による動画像中の物体追跡, 電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 = IEICE technical report. IBISML, Information-based induction sciences and machine learning, Vol.110, No.188, pp.165-171, 2010.08, 一般的な動的計画法(DP)による動画像中の物体の追跡は,画像サイズや物体の変形パラメータ(平行移動,拡大縮小,回転など)の増加により計算量が非常に大きくなる.これに対し,解析的DPの導入により計算量の低減を図った追跡手法が提案されている.解析的DPとは,目的関数を部分的に連続関数(2次関数)表現することで微分可能とし,その上でDP の再帰計算を適用することで,高速に最適解を求める手法である.しかし,これまでの解析的DPを用いた追跡手法は,本来複雑な目的関数を各フレームにつき1つの2次関数で表現していたため,その追跡精度には限界があった.そこで本論文では,各フレームにつき複数の2次関数を用いて目的関数を表現することで,解析的DPの高速性を保ちながら,より高精度な追跡を行うことができる手法について提案する..
149. 川野 裕希, 藤村 一行, フォン ヤオカイ, 内田 誠一, 離散型DPと解析的DPの統合による動画像中の物体追跡, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.110, No.187, pp.165-171, 2010.08, 一般的な動的計画法(DP)による動画像中の物体の追跡は,画像サイズや物体の変形パラメータ(平行移動,拡大縮小,回転など)の増加により計算量が非常に大きくなる.これに対し,解析的DPの導入により計算量の低減を図った追跡手法が提案されている.解析的DPとは,目的関数を部分的に連続関数(2次関数)表現することで微分可能とし,その上でDPの再帰計算を適用することで,高速に最適解を求める手法である.しかし,これまでの解析的DPを用いた追跡手法は,本来複雑な目的関数を各フレームにつき1つの2次関数で表現していたため,その追跡精度には限界があった.そこで本論文では,各フレームにつき複数の2次関数を用いて目的関数を表現することで,解析的DPの高速性を保ちながら,より高精度な追跡を行うことができる手法について提案する..
150. 岩村 雅一, 古谷 嘉男, 黄瀬 浩一, 大町 真一郎, 内田 誠一, 付加情報の一般的な割当(パターン認識), 電子情報通信学会論文誌. D, 情報・システム, Vol.93, No.5, pp.579-587, 2010.05, 特徴量のみでは本質的に避けることができない誤認識を回避するために,付加情報を用いるパターン認識という枠組みが提案されている.この方式では,パターン認識を行う際に,付加情報と呼ばれるクラスの決定を補助する少量の情報を特徴量と同時に用いて認議性能の改善を目指す.付加情報は自由に設定でき,通常は誤認識率が最小になるように設定する.ここで問題となるのは,誤認識率が最小になる付加情報の設定方法である.常に正しい付加情報が得られるいう理想的な条件においては既に問題が定式化され,付加情報の割当方法が導かれている.しかし,実環境での使用を考えると,付加情報に生じる観測誤差を考慮した割当方法が求められる.そこで本論文では付加情報の観測誤差を考慮に入れて,問題を新たに定式化する.これは付加情報が誤らない場合にも有効な一般的なものである.本論文で導いた割当方法が有効に機能することをマハラノビス距離を用いた実験で例示する..
151. 福冨 正弘, 小川原 光一, 馮 尭楷, 内田 誠一, 相互制約付き多数決型アルゴリズムによる時系列パターン認識, 電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition), Vol.93, No.4, pp.548-551, 2010.04, 本論文では,時系列パターンの認識手法として,各サンプル点(各時刻)で認識すなわちクラスラベルの決定を行い,最終的にクラスラベル数の多数決によってクラスを確定する手法を検討する.その一つの特徴として,必要に応じて複数サンプル点間に相互制約を設け,それらをできるだけ同じクラスにラベリングする点が挙げられる.これにより,クラスラベルの割当方を制御でき,自由度の高い識別が可能となる.クラスラベルの割当の組合せは総サンプル点数に対し指数関数的に増加する.そこで,グラフの最小切断アルゴリズムいわゆるグラフカットを用いることで,総サンプル点数に対して多項式時間での計算を実現する.オンライン文字データを対象とした認識実験を行い,本手法の有効性を検証した..
152. 内田誠一, Marcus Liwicki, 岩村雅一,大町真一郎,黄瀬浩一, ディジタルペン, 映像情報メディア学会誌, 同会誌2010年3月号 ベストオーサー 記事, 2010.03.
153. 近野 恵, 岩田 和将, 黄瀬 浩一, 岩村 雅一, 内田 誠一, 大町 真一郎, データベースおよびクエリの拡張による文書画像検索の精度向上法(一般,顔・人物・ジェスチャ・行動), 電子情報通信学会技術研究報告. HIP, ヒューマン情報処理, Vol.109, No.471, pp.507-512, 2010.03, 本稿では,我々が開発中のカメラペンシステムで使用する,文書画像検索の精度向上法を提案する.カメラペンシステムとは,カメラを取り付けたペンで書いた印刷文書への筆跡を,デジタルデータとして復元するシステムである.文書画像検索はデータベースから撮影画像の対応範囲を検索することで,筆跡を求める役割を担っており,高精度での検索が必要不可欠である.しかし現状では,撮影画像に生じる射影歪みの影響で検索精度が低下している.そこで,この問題を解決するために,検索に用いる特徴量の改良,および射影歪みを発生させた画像を生成し,データベースを拡張する手法と,撮影画像を基にクエリを拡張して検索する手法の3つを提案する.有効性を検証するため,改良した特徴量と拡張手法をそれぞれ組み合わせ,改良前の従来手法と比較実験を行った.その結果,改良した特徴量を用い,クエリを拡張した手法を用いたときに,最も精度が向上した..
154. 近野 恵, 岩田 和将, 黄瀬 浩一, 岩村 雅一, 内田 誠一, 大町 真一郎, データベースおよびクエリの拡張による文書画像検索の精度向上法, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.470, pp.507-512, 2010.03, 本稿では,我々が開発中のカメラペンシステムで使用する,文書画像検索の精度向上法を提案する.カメラペンシステムとは,カメラを取り付けたペンで書いた印刷文書への筆跡を,デジタルデータとして復元するシステムである.文書画像検索はデータベースから撮影画像の対応範囲を検索することで,筆跡を求める役割を担っており,高精度での検索が必要不可欠である.しかし現状では,撮影画像に生じる射影歪みの影響で検索精度が低下している.そこで,この問題を解決するために,検索に用いる特徴量の改良,および射影歪みを発生させた画像を生成し,データベースを拡張する手法と,撮影画像を基にクエリを拡張して検索する手法の3つを提案する.有効性を検証するため,改良した特徴量と拡張手法をそれぞれ組み合わせ,改良前の従来手法と比較実験を行った.その結果,改良した特徴量を用い,クエリを拡張した手法を用いたときに,最も精度が向上した..
155. 近野 恵, 岩田 和将, 黄瀬 浩一, 岩村 雅一, 内田 誠一, 大町 真一郎, データベースおよびクエリの拡張による文書画像検索の精度向上法, 電子情報通信学会技術研究報告. HIP, ヒューマン情報処理, Vol.109, No.471, pp.507-512, 2010.03.
156. 諸岡 健一, 陳 献, 倉爪 亮, 内田 誠一, 原 健二, 砂川 賢二, 橋爪 誠, 非線形有限要素解析を模したニューラルネットワークを用いた軟性臓器ボリュームモデルの変形シミュレータ, 電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition), Vol.93, No.3, pp.365-376, 2010.03, 本論文では,ニューラルネットワークを用いて,軟性臓器モデルの変形をシミュレートする新たな手法を提案する.提案手法は,基本的なモデルの変形(以後,変形モードと呼ぶ)の組合せに基づいて,モデルの変形を推定する.つまり,変形モードをあらかじめ非線形有限要素法で求め,臓器に加わった外力と,それに対応する変形モードの関係をニューラルネットワークで学習する.学習したニューラルネットワークは,非線形有限要素解析によりモデルの振舞いを推定することを模倣する.実験結果より,提案手法は,非線形有限要素解析とほぼ同程度の精度を保ちつつ,計算コストを大幅に削減することができた..
157. 内田 誠一, Liwicki Marcus, Marsault Vincent, Part-based 文字認識の試み手書き数字認識に大局的構造は必要か?, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.418, pp.13-18, 2010.02, 「文字の大局的構造を用いずに,その断片群を観察するだけで,どれぐらいの認識率が得られるだろうか?」-本稿では今まで顧みられることのなかったこの疑問に取り組む.そして,手書き数字画像データベースMNIST中の2万サンプルを用いた実験を通して,大局的構造を用いなくても90%以上の認識率が得られることを示す.断片群すなわち局所部分の集合を用いた認識は,part-based認識とも言われ,物体認識の分野では既に様々なアプローチが試みられている.本稿は,白黒2値の単純な線図形という,ある意味part-basedでは最も見分けが付きにくいパターンに対する試みであるとも言える..
158. Liwicki Marcus, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, データ埋め込みペンの実装, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.418, pp.105-110, 2010.02, 本稿では,筆記時にストロークに沿って付加情報を埋め込むペン-データ埋め込みペン-について,その原理と実装結果について論ずる.付加情報はペン先に装着されたインクジェットノズルからの微小インク滴として塗布される.データはこのインク滴の間隔などを制御することで表現される.実験の結果,少なくとも28ビットの埋め込みおよび復元に成功した..
159. 田島 修司, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, ペン先カメラ画像と紙面上特徴点を用いた手書きパターンの復元, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.418, pp.7-12, 2010.02, 日常の手書きパターンをデータ化・保存する技術として,ペン先に搭載したカメラから得られる画像を利用した,手書きパターンの取得・復元する方法を検討している.復元は,紙面上の細かな紋様(紙紋)上の特徴点に依拠した,ビデオモザイキングを原理としている.以前の検討により,この枠組みによりある程度の精度で復元可能なことを,手書き数字を対象とした実験により実証している.ただし,今後の精度改善のためには,定量的評価を含めた更なる解析が必要と考える.本報告では,単純な手書きパターンを主たる復元対象として,どのような場合にどのような復元精度劣化が起こるかなどの検証を行った結果について述べる..
160. 大場 慎平, 小野 善太郎, 馮 尭楷, 内田 誠一, 局所特徴を利用したナンバープレート検出, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.418, pp.1-6, 2010.02, ナンバープレートは様々な情報を含んでおり,その画像の公開はプライバシーの問題に繋がることがある.本論文では,任意視点において撮影された実環境画像中のナンバープレートを局所特徴抽出法であるSURFを用いて検出をし,検出したプレート領域に対して隠蔽処理を行う.局所特徴を利用することでプレートの見えの変化やオクルージョンなどに対応できる.検出は,学習パターンと入力パターンから局所特徴を抽出し,その抽出した学習パターンの特徴点群と入力パターンの各特徴量を比較することで行う.そして検出されたプレート領域に対しGaussianフィルタを用いて隠蔽処理を施す.本手法の効果を確認すべく,単数および複数車両におけるナンバープレート検出実験を行い,実験の結果,本手法の有効性を確認した..
161. 小野 善太郎, 堀田 政二, 馮 尭楷, 内田 誠一, 局所特徴量を用いた事例参照に基づく位置同定, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.418, pp.31-36, 2010.02, 本論文では,撮影地点既知の参照画像群を用いた入力画像の撮影地点の同定について,局所特徴を用いた手法を比較検討する.検討している位置同定法は,入力画像及び撮影地点既知の参照画像から局所特徴を抽出し,入力画像特徴と参照画像特徴を比較し,k近傍法により求められる撮影地点を入力画像特徴の認識結果とする.そして,入力画像全ての局所特徴の認識結果から多数決により最も多くの結果を出した地点を入力画像全体の認識結果とする.局所特徴量には,画像を分割したブロック,もしくはSURFを用いた.両者の比較の結果,性能の高かったSURFについてその特徴点の分布等を解析した..
162. 岩田 和将, 黄瀬 浩一, 岩村 雅一, 内田 誠一, 大町 真一郎, 特徴追跡と文書画像検索を用いたカメラペンシステム, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.418, pp.39-44, 2010.02, 本研究では,ペンにカメラを搭載し画像処理をすることで,筆跡をデジタルデータとして取得する手法を提案する.筆記には,単純な白紙へのメモ書きや,文書への下線などの文書に情報を加えるものがある.そこで,白紙において筆跡の復元可能で,かつ文書領域では筆記対象の文書名や文書中の位置を特定できる必要がある.この要求を実現するため,本研究では,既に提案されている白紙に対応する手法と文書画像検索が可能な手法を統合する.統合の際の大きな問題は,両手法で処理に必要な撮影範囲が大幅に異なる点(前者は狭く,後者は広い)である.この問題に対処するため,提案手法では画像モザイキングを導入する.筆跡の復元は,前者の手法により紙の凹凸や印刷文字から得られるSURF特徴点の追跡により実現する.同時に,SURF特徴点を用いたモザイキングにより画像を貼り合わせる.十分な大きさの領域が得られると,後者の手法により文書画像を検索し筆跡を文書に対応付ける.本稿では,復元された筆記を実験により評価するとともに,今後の課題についても考察する..
163. 國重 康弘, 馮 尭楷, 内田 誠一, 環境コンテキスト利用による情景画像中文字検出, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.418, pp.81-86, 2010.02, 情景画像中の文字検出とは,デジタルカメラ等で撮影された画像中に存在する文字領域を特定する処理である.従来の文字検出に関するアプローチとは,文字の形状に着目することで,画像中から文字領域を特定しようという試みが一般的であった.しかし,文字の形状は多種多様であり,サイズも不特定であるため,形状に関する特徴のみを利用した手法では,検出精度を高めることに限界があると考えられる.そこで,本論文では,このような手法とはアプローチを変え,文字の形状だけではなく文字の存在する環境に着目して文字検出を行う手法を提案する.実験により,文字領域周辺の環境コンテキスト情報を利用することによって,文字検出の精度が向上することを確認した..
164. 外堀 悟士, 馮 尭楷, 内田 誠一, 解析的DPマッチングを用いた手書き数字認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.418, pp.147-152, 2010.02, 弾性マッチングとは,2つの画像間をマッチングする際に一方をゴムのように伸縮させマッチングを行う手法である.弾性マッチングを用いることにより,手書き文字における人間の筆跡の違いや文字の大きさといった差異に柔軟に対応することができる.解析的2次元DPマッチングは,離散的DPマッチングの局所距離を2次関数近似することで解析的な解法を適用可能としたもので,弾性マッチングの中でも柔軟性と高速性を両立させた手法に位置付けられる.本研究では,手書き数字画像データベースMNISTを用いた認識実験を行い解析的2次元DPマッチングの性能評価を行う..
165. 内田 誠一, 伊東 克啓, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, ペン先画像からの手書き復元(研究速報), 電子情報通信学会論文誌. D, 情報・システム, Vol.93, No.1, pp.64-67, 2010.01, 本論文では,ペン先カメラの映像から,手書きパターンを復元できることを実証する.具体的には,紙面の微細構造-紙指紋-の動きに着目したビデオモザイキング法により,ペン先の軌跡すなわち手書きパターンを推定できることを示す..
166. 田村 暁斗, 諸岡 健一, 倉爪 亮, 岩下 友美, 内田 誠一, 原 健二, 中西 洋一, 橋爪 誠, 長谷川 勉, AdaBoost による気道・食道自動識別, 電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition), Vol.92, No.12, pp.2249-2260, 2009.12, 気道確保法の一つである気道挿管では,通常まず喉頭鏡を使って喉頭展開を行い,声門の位置を目視により確認する.しかし実際の医療現場では,上気道閉塞など様々な要因で,声門の位置を目視により確認しづらい場合がある.この不完全な確認が原因で食道へ誤挿管した場合,気道が確保されず危険なだけでなく,無理な目視のために頸椎や歯牙損傷などの合併症を引き起こす危険性がある.安全・確実な気道挿管の実現に向けて,我々は,スタイレット先端に小型カメラを搭載した自動気管内挿管システムを開発することを自指している.本論文では,その要素機能として,カメラから取得される画像から,挿管チューブが気道あるいは食道に挿管されているかを自動的に識別する方法を提案する.本手法は,気道画像には気道周囲の輪状軟骨が特徴的に観察されることから,まずこの環状模様の記述に適した特徴量を定義し,それに基づいた気道・食道識別器をAdaBoostによって構築する.実験の結果,97.6%の高い識別率で気道・食道の判別が可能であり,提案手法の有効性が確認できた..
167. 鷲見 和彦, 内田 誠一, 佐藤 真一, 佐藤 洋一, 日浦 慎作, 福井 和広, 馬場口 登, パターン認識・メディア理解のグランドチャレンジ, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.109, No.344, p.19, 2009.12.
168. 近野 恵, 岩田 和将, 黄瀬 浩一, 岩村 雅一, 内田 誠一, 大町 真一郎, カメラペンシステムの検索精度向上のための一手法, 平成21年電気関係学会関西支部連合大会 講演論文集, 2009.11.
169. 山下 健司, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 検出容易な文字パターン生成に関する検討, 電気関係学会九州支部連合大会講演論文集, 2009.09.
170. 内田 誠一, 佐藤 真一, 鷲見 和彦, 福井 和広, 4.パターン認識・メディア理解の問題分析(パターン認識・メディア理解のグランドチャレンジ), 電子情報通信学会誌, Vol.92, No.8, pp.656-664, 2009.08, 本稿ではパターン認識,メディア理解の中でも,特に画像認識・理解に焦点をあてて,その問題について考える.まず画像理解独特の難しさを分析・整理する.次に,最近,急激に普及してきている顔画像認識を取り上げて,なぜ実用化がうまくいったのかを分析し,その特殊性を明らかにする.最後にこれまで開発された様々な画像認識・理解技術を物理モデル・統計モデル・意味モデルという三軸が張る空間で統一的にとらえ,未来へ向けて今後どのようなアプローチを取ればよいのかについて考える..
171. 鷲見 和彦, 内田 誠一, 佐藤 真一, 佐藤 洋一, 日浦 慎作, 福井 和広, 馬場口 登, 5.パターン認識・メディア理解の10大チャレンジテーマ(パターン認識・メディア理解のグランドチャレンジ), 電子情報通信学会誌, Vol.92, No.8, pp.665-675, 2009.08, パターン認識・メディア理解分野において,次の10年に解くべき問題として,画像生成過程が不確定的な場合のモデル化,統計モデルの困難さの克服,及び,意味・内容にかかわる問題がある.このような技術要素を含み,科学技術として挑戦する度合いが高く,かつ,成功した場合の社会的な波及効果が大きいことを基準に,今後10年間にチャレンジすべき重要テーマを例示した.これらは,人間の行動の認識・理解・評価,画像情報の関連付けと全自動構造化,視覚情報からの意味ある情報を抽出,人に不足する視覚情報の検出と提示,状況観察による危険予知,健康・医療における画像診断,人の観察による環境認識,一般情景内に存在する文字の認識,地球規模のセンサから得られる膨大な情報の処理,そして最終的には,画像に対する意味の記述を人と同じレベルで可能にすることである.本稿では,この10大チャレンジテーマについて具体的に解説した..
172. 藤村 一行, 内田 誠一, 大局的最適化に基づくトラッキング : DPトラッキング(追跡・位置合わせ,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文), 電子情報通信学会論文誌. D, 情報・システム, Vol.92, No.8, pp.1279-1288, 2009.08, 映像中の物体のトラッキングは,その物体のフレーム間の移動量の最適推定問題として定式化される.本論文では,その大局的最適解を得るために,動的計画法(DP)を用いたトラッキング手法を提案する.従来,幅優先探索の一種として扱われていたDP最適化では,画像のサイズやパラメータの増加により,探索幅が非常に大きくなり計算量が増加するという問題がある.これに対し本論文ではDPの解析的解法をトラッキング問題に適用する.これは,最適化の評価に用いられる局所的な誤差関数を二次関数近似することで,DPによる最適化過程に微分による最適化を導入した手法である.幅優先探索なしに解析的にかつ高速に最適解を得ることができ,トラッキング問題には特に有効といえる.本論文では,本手法の定式化と実験結果を示す..
173. 〆野 敦稔, 内田 誠一, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 自己発信情報の組み込みによる移動体の分離追跡, 電気学会論文誌. C, 電子・情報・システム部門誌 = The transactions of the Institute of Electrical Engineers of Japan. C, A publication of Electronics, Information and System Society, 10.1541/ieejeiss.129.977, Vol.129, No.5, pp.977-984, 2009.05, Tracking of a moving robot in surveillance video is an important task for coexistence of human beings with robots. An essential technology to manage coexistence environment of human beings and moving robots is separation and tracking of moving robots. For this task, the moving robot should be separated from other moving objects, i.e., human beings. We assume that the robot provides its additional motion information to the surveillance system to ease the task. The robot can be tracked from the other objects as a moving region being consistent with the additional motion information. For this purpose, we modify a tracking algorithm based on particle filter in order to incorporate the additional motion information. The results of an experiment on real surveillance video sequences have indicated that the proposed framework can separate and track a moving robot under the existence of several walking persons..
174. 伊東 克啓, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, ペン先カメラ画像からの手書きパターンの抽出, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.108, No.432, pp.19-24, 2009.02, 本研究では,日常の手書き内容を保存できるライティング・ライフ・ログの実現のための要素技術として,ペン先付近にカメラを搭載し,手書きパターンをリアルタイムに取得・復元する方法を提案する.実際に手書き内容を得るためには,動画像の各フレームについてビデオモザイキングを行う必要がある.すなわち各フレーム画像について位置合わせをしながら統合し,パターン全体を復元する必要がある.本手法の特徴は,紙指紋と呼ばれる紙面の微細構造を積極的に利用する点にある.具体的には紙面よりSURF特徴点を抽出し,それに基づいてフレーム間の特徴点対応を求める.この対応関係を基にフレーム間の射影変換行列を求めて位置合わせを行う.これを全フレームについて行うことで最終的に1枚の手書きパターン画像を生成する.幾つかの実例を通して,本手法の基本性能を検証した..
175. 丹羽 亮, 岩村 雅一, 黄瀬 浩一, 内田 誠一, 大町 真一郎, レイアウトに依らない平面文書画像の射影歪み補正, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.108, No.432, pp.151-156, 2009.02, 近年,デジタルカメラをスキャナの代わりに用いて文書画像処理を行う試みが盛んに研究されている.しかし,既存の文書画像処理技術の多くはスキャナで取得した文書画像を対象としているため,デジタルカメラで斜めから撮影した文書画像には適用できない.このような場合,文書画像に生じた射影歪みを補正し,スキャナで取得したかのような真正面の文書画像を得る必要がある.既存の方法だと,文書の枠の有無や文字行の平行性あるいは,ステレオカメラによる撮影やビデオカメラの使用などの制約がある.本稿では,文字の面積や変形に着目した自由なレイアウトの文書へ適用できる歪み補正を提案し,実験により手法の有効性を確認する..
176. 山口 晃典, 内田 誠一, 植竹 朋文, 松下 知紀, 初期活字印刷本中の文字の形状解析, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.108, No.432, pp.1-6, 2009.02, 中世代に作成された初期活字印刷本について,文字の形状解析および文字認識手法について検討する.初期活字印刷本中の文字形状には,様々な要因による字形変動が存在し,認識の妨げとなっている.また,既に2値化された画像しか存在しない,対象とする資料以外からは文字情報を得ることができない,などという状況も考えられる.そこで本研究では,2値化された文字画像の最外郭輪郭線の形状に着目し,形状解析および文字認識を行う.具体的には,資料の冒頭数ページから切り出してラベル付けした文字画像を辞書サンプルとして,同カテゴリ内文字の位相変化別変位の抽出,そしてそれらの情報を用いて資料の残りのページから切り出した文字画像に対して認識を行う.この方法により,掠れや途切れを起こしているパターンの情報も利用して文字形状解析・認識を行うことができる.本報告では,実際に実験を行った結果についても述べる..
177. 内田 誠一, 文字・文書の認識・理解に関するグランドチャレンジ私案, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.108, No.432, pp.49-54, 2009.02, 文字・文書の認識・理解問題は既にほとんど解決済のように思われるかも知れない.確かに,先人の多大なる努力により,実用化されて身近な技術となっている部分も多い.しかし実際には,現状の技術で扱える範囲においてのみ実用化されているというべきであり,工学的にもサイエンス的にも数多くの課題が残されている.本報告は,PRMU「グランドチャレンジ2008」企画の一つの支流として,文字認識研究の未解決問題を概観した上で,そこで今後取り組むべきと思われる幾つかの課題について私案を述べたい.良きにつけ悪しきにつけ,当該分野の研究者による議論の端緒となり,また新規参入の契機を産むことを祈っている..
178. 服部 亮史, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 検出容易な文字パターン生成に関する検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.108, No.432, pp.7-12, 2009.02, 情景画像中の文字領域を検出する処理に関して,検出が容易となる文字パターンの生成について検討する.従来の文字領域検出処理は,あらゆる文字パターンが共通して持つ普遍的な特徴を用いて文字領域と非文字領域を識別することで実現される.しかし用いた特徴では検出できない例外的なパターンが存在したり,検出対象が存在する環境によっては検出が極めて困難になるなどの問題も多い.本研究では,検出が容易となる特徴を備えた文字パターンを生成するという視点からこの問題を捉える.具体的には,検出特徴空間において非文字分布から最も離れた文字分布内の点を,検出が容易なパターンと定める.この考え方により生成されるパターンは,検出特徴,文字分布,非文字分布,パターン間の距離の定義に依存して異なってくる.その一例として部分空間法を応用したパターン生成手法を提案し,また提案手法により生成された文字の検出容易性を確認した..
179. 首藤 巧至, 内田 誠一, 諸岡 健一, 倉爪 亮, 原 健二, Boosting によるカメラ選択を用いた行動認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.108, No.363, pp.61-66, 2008.12, 環境の監視等を目的として,マルチカメラシステムによる多視点行動認識手法を提案する.本手法は次の3つの性質を持つ.第一は各カメラの視野を配慮した相補的な情報統合,第二はキャリブレーションフリーなシステムであること,第三は異種センサの組み込み可能性である.これらの性質は各カメラに付随した識別器による認識結果を統合するという枠組により実現される.具体的には,AdaBoostを用い各カメラに付随した識別器を取捨選択および統合しながら,マルチカメラシステム全体として高精度な識別器を自動構成する.本稿ではさらに,このカメラ識別器の取捨選択の際に局所領域選択を導入することを検討する..
180. 〆野 敦稔, 内田 誠一, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, モード切り替えを伴うパーティクルフィルタ, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.108, No.363, pp.1-6, 2008.12, 本稿では,自律移動ロボット(以下,移動体)と人間の共存環境構築のための要素技術として,移動体と人間が混在する環境映像から移動体のみを分離追跡する問題を扱う.具体的には,移動体が自らの移動に関する情報を監視システムに常に自己発信している状況を仮定し,その自己発信情報を環境映像と統合することで,移動体のみを高精度に追跡する方法を提案する.追跡のアルゴリズムはパーティクルフィルタを基本とし,そこに自己発信情報を組み込むことで,移動体の状況に応じた追跡制御を実現する.自己発信情報としては,移動体が直進,曲線的移動,停止の3つの移動モードのいずれにあるかという単純なものを考える..
181. 田中 一弘, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, データ埋め込みペンに関する基礎的検討, ヒューマンインタフェース学会論文誌, Vol.10, No.4, pp.559-567, 2008.11.
182. 片山 喜規, 内田 誠一, 迫江 博昭, 座標特徴と方向特徴の選択的利用に基づくオンライン文字認識HMM(画像認識,コンピュータビジョン), 電子情報通信学会論文誌. D, 情報・システム, Vol.91, No.8, pp.2112-2120, 2008.08, 本論文では,高精度なオンライン文字認識のために,方向特徴並びに座標特徴を適切に使い分け可能な隠れマルコフモデル(HMM)を提案する.両特徴はいずれもオンライン文字認識の基本的な特徴量でありながら,全く異なった性質を示す.すなわち,線分内で方向特徴が定常的なのに対し,座標特徴は常に非定常である.したがって,HMMの枠組みにおいて両特徴を同等に扱うのは問題が多い.実際従来法では,座標特徴を用いずに方向特徴だけが用いられることが多かった.本論文で提案するHMMでは,方向特徴を状態内自己遷移における出力シンボルとして使用し,座標特徴を状態間遷移における出力シンボルとして使用する.このようにすることで,線分方向が一定した定常的な部分においては方向特微が,線分の方向が変化する過渡的な部分においては座標特徴が評価されることになる.このように特徴を使い分けることで,従来法に比べ認識精度を大幅に向上できることを,多画文字(漢字)の筆順フリー認識実験並びにその詳細な考察を通して示す..
183. 内田 誠一, 酒井 恵, 岩村 雅一, 事例に基づく文書画像の回転角推定法, 画像ラボ, Vol.19, No.7, pp.5-10, 2008.07.
184. 片山 喜規, 内田 誠一, 迫江 博昭, 筆順変動を表現するHMMとそのオンライン文字認識への応用(画像認識,コンピュータビジョン), 電子情報通信学会論文誌. D, 情報・システム, Vol.91, No.5, pp.1434-1441, 2008.05, 本論文では,筆順フリーなオンライン文字認識の高精度化を目指し,(i)筆順変動の統計的モデルの構築,及び(ii)その認識における利用,の2点について検討する.一般に筆順フリー化には不自然な画対応の許容による誤認識の問題があるが,提案する筆順変動モデルを用いることでそれらを抑制できる.この筆順変動モデルは,筆順フリー認識のためのグラフモデル(キューブグラフ)の確率的拡張として定式化され,結果的に文字形状に関するゆう度と筆順のゆう度を同時に扱うことが可能な隠れマルコフモデル(HMM)の一種となる.公開されているオンライン文字データベース"HANDS-kuchibue.d-97-06-10"を用いた認識実験により,筆順変動モデル導入の有効性及び妥当性を明らかにした..
185. 椛島 佑樹, 原 健二, 倉爪 亮, 岩下 友美, 諸岡 健一, 内田 誠一, 長谷川 勉, 逆投影と幾何拘束を用いた2D/3D位置合せ, 電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition), Vol.91, No.5, pp.1380-1392, 2008.05, レンジセンサにより取得した幾何モデルにカラーセンサで撮影したテクスチャ画像を貼り付けて表示するテクスチャマッピングを容易に実現するには,テクスチャ画像と幾何モデルのみからカラー・レンジセンサ間の相対位置関係を知ることが望ましい.本論文では,幾何拘束に基づく大域的手法とエッジの対応付けに基づく局所的手法の組合せにより,センサ間の相対位置・姿勢を初期値の変動にロバストにかつ高精度に推定し,テクスチャ画像と幾何モデルの位置合せを実現する手法を提案する.本手法はまず,テクスチャ画像から稜線と平面領域を抽出する.次に,この稜線と平面領域を幾何モデルに逆投影し,対象における幾何拘束条件を推定しつつ,この拘束条件のもとでセンサ間の相対位置・姿勢の初期推定値を求める.最後に,テクスチャ画像と幾何モデルの各エッジ間の対応付けに基づき,センサ間の相対位置・姿勢を決定する.実験では,エッジ間の対応付けに基づく従来手法と比較して,位置合せの成功率が41%から75%に向上した..
186. 内田 誠一, DP-1-3 パターン認識・メディア理解の挑戦すべき課題 : パターン認識基礎と文書認識の視点で(DP-1. パターン認識・メディア理解の挑戦すべき課題-2010年代に向けて-,パネルセッション,ソサイエティ企画), 電子情報通信学会総合大会講演論文集, Vol.2008, No.2, pp."SS-3", 2008.03.
187. 片山 喜規, 内田 誠一, 迫江 博昭, オンライン文字認識HMMにおける座標特徴と方向特徴の利用方法の検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.107, No.491, pp.87-92, 2008.02, 本論文では,高精度なオンライン文字認識のために,方向特徴ならびに座標特徴を適切に使い分け可能な隠れマルコフモデル(HMM)を提案する.両特徴はいずれもオンライン文字認識の基本的な特徴量でありながら,全く異なった性質を示す.すなわち,線分内で方向特徴が定常的なのに対し,座標特徴は常に非定常である.したがって,HMMの枠組において両特徴を同等に扱うのは問題が多い.実際従来法では,座標特徴を用いずに方向特徴だけが用いられることが多かった.本論文で提案するHMMでは,方向特徴を状態内自己遷移における出力シンボルとして使用し,座標特徴を状態間遷移における出力シンボルとして使用する.このようにすることで,線分方向が一定した定常的な部分においては方向特徴が,線分の方向が変化する過渡的な部分においては座標特徴が評価されることになる.このように特徴を使い分けることで,従来法に比べ認識精度を大幅に向上できることを,多画文字(漢字)の筆順フリー認識実験ならびにその詳細な考察を通して示す..
188. 山口 晃典, 内田 誠一, 千葉 淳一, 飯田 周作, 植竹 朋文, 松下 友紀, 中世英文学資料の認識および解析 : 意義・問題点および予備検討結果, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.107, No.491, pp.155-160, 2008.02, 「Anglo-Saxon語の継承と変容」プロジェクト(専修大学)では,1200-1600年代に作成された手稿写本や初期印刷本といった中世英文学資料のデジタルテキスト化を目指し,そのためのOCRの開発を行っている.本報告では,手稿写本に比べれば比較的扱いやすい初期印刷本(1500年前後の活字印刷本)について,それら文書の様々な性質を論じる.また「農夫ピアズ」初期印刷本の孤立文字データを用いて,小規模ながら実際に文字認識実験を行った結果について論ずる..
189. 酒井 恵, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 文書画像の事例ベース傾き補正の改良, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.107, No.491, pp.1-6, 2008.02, 文書画像の回転(スキュー)を補正するため,事例ベース傾き補正法を提案している.事例を用いることにより,文書の直進性を仮定せずに回転角を推定できる.また,事例として回転変量と不変量を用いることにより効率的に回転角を推定できる.変量と不変量はどのようなものでも良いが,前回の報告で用いていた不変量はノイズに弱いという問題があった.そこで本報告では,回転角推定の精度向上を目的として,不変量の多次元化について述べる.計算機内実験において文書画像55サンプルを用いて,簡単な傾き推定実験を行ったところ,48サンプルにおいて誤差1度以下,全てのサンプルにおいて誤差2度以下という精度を得た.また,スキャナ取得画像に対しても評価実験を行った所,目視ではあるが入力10画像中9画像に対して正しく補正できた..
190. 天本 一馬, 内田 誠一, 早期認識のための Boosting 的学習法の提案とそのオンライン文字認識への応用, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.107, No.491, pp.81-86, 2008.02, 時系列パターンの早期認識とは,入力の終了を待たずに早い段階で結果を確定する手法である.本報告では,第t-1フレームまでで識別ができなかった学習パターンを第tフレームの識別器構成の際に重視することで,冒頭部では識別しにくいパターンのできる限り早い段階での識別を可能とする方法を提案する.これはAdaBoostに類した学習法として定式化される.この手法を用いたオンライン文字の早期認識実験を行い,その有用性を確認した..
191. 内田 誠一, 酒井 恵, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 事例に基づく文書画像の回転角推定(研究速報), 電子情報通信学会論文誌. D, 情報・システム, Vol.91, No.1, pp.136-138, 2008.01, 各文字の回転変形に対する変量と不変量を事例として学習しておき,それらを利用することで文書画像の回転角を推定する方法を提案する.本手法は,文字単位で回転角を効率的に推定するため,文字列が直線的かつ平行にレイアウトされているという仮定が不要であり,したがって様々なレイアウトの文書に利用可能である..
192. 古谷 嘉男, 岩村 雅一, 黄瀬 浩一, 大町 真一郎, 内田 誠一, 付加情報の誤りと誤認識率の関係, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.107, No.384, pp.95-100, 2007.12, 通常のパターン認識とは異なる,付加情報を用いるパターン認識という新しい枠組みが提案されている.これは,通常のパターンと同時にそれを補助する情報(付加情報)をパターンとは別に用意し,それらを同時に用いることにより誤認識率を減少させる方式である.これまでに,付加情報の復元を誤らないという仮定の下で,誤認識率を理論的に最小にする方法が提案されている.しかし,現実世界で付加情報の復元を行うと,観測誤差があるため付加情報の復元を誤らないということは稀である.そこで,本稿では,付加情報の復元を誤る際に,どのようにして付加情報を与えれば誤認識率を減少させることが可能であるかについて検討を行い,それに基づく実験を行うことで,誤認識率が減少する可能性があることを示す..
193. 大町 真一郎, 岩村 雅一, 内田 誠一, 黄瀬 浩一, 実環境文字認識のための面積比による付加情報埋込(画像認識,コンピュータビジョン), 電子情報通信学会論文誌. D, 情報・システム, Vol.90, No.12, pp.3246-3256, 2007.12, ディジタルカメラを入力デバイスとして実環境中の文字を高精度に認識するために,文字画像と同時に認識補助のための付加情報を提示する方法が検討されている.付加情報は,人間にとって自然な形で提示されること,及び,幾何学的変形に対してロバストに抽出できることが要求される.本論文では,これらの要求を満たす手法として,面積比を利用した付加情報提示手法を提案する.すなわち,文字パターンを2色で印字することを前提とし,それぞれの色の領域の面積比を特定の値とするようにデザインする.具体的には,文字に影を付加したり輪郭線を別の色とする.これらは文字パターンのデザインとして既に行われており,提案手法はその線幅や面積を変えるにすぎない.したがって,提案手法は様々な用途に広く応用することが可能である.面積比はアフィン変換に不変であり,アフィン変換を受けた環境においても誤りなく抽出されることが期待される.実際に付加情報を埋め込んだ文字パターンを作成し,ディジタルカメラで撮影された画像中の文字パターンから付加情報を抽出する実験を行い,提案手法の有効性を確認する.また,付加情報を用いて文字を認識する実験を行い,認識精度が向上することを確認する..
194. 篠村 祐司, 原野 友敬, 玉木 徹, 天野 敏之, 金田 和文, 内田 誠一, 人物歩行予測における軌跡取得方法の検討, 第9回IEEE広島支部学生シンポジウム(HISS)論文集, 2007.11.
195. 内田 誠一, 酒井 恵, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, オートマトン制御付き最適セグメンテーション法とその実環境文字認識への応用(画像処理,画像の認識・理解論文), 電子情報通信学会論文誌. D, 情報・システム, Vol.90, No.8, pp.1966-1976, 2007.08, 本論文では,動的計画法(DP)と有限状態オートマトン(FSA)の組合せに基づいた,一次元信号の最適セグメンテーション手法を提案する.具体的には,信号の性質(例えば信号の値が高い区間と低い区間が交互に繰り返すと言った性質)をFSA表現した上で制約条件としてセグメンテーション問題に組み込み,その制約下での大局的最適セグメンテーションをDPにより効率的に求める.FSAの導入により,信号の性質と一致しないセグメンテーション結果は排除され,精度の向上が見込める.更に,FSA状態と各区間の対応結果によって各区間の意味付けも可能となる.本論文では本手法の詳細を述べるとともに,更にある種の実環境文字画像認識タスクに適用することでその有効性を評価する..
196. 岩下 友美, 倉爪 亮, 原 健二, 内田 誠一, 諸岡 健一, 長谷川 勉, 並列 Fast Level Set Method による移動体の高速な三次元形状復元, 電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition), Vol.90, No.8, pp.1888-1899, 2007.08, 多数台のカメラによりシーン内に存在する対象物体の全周の幾何情報及び光学情報を取得し,任意視点からの画像を生成する手法として,視体積交差法と多視点ステレオ法が提案されている.しかしこれらの手法は単一物体あるいはオクルージョンの生じない複数物体を対象とした手法であり,シーン内に複数物体が存在し物体間に相互オクルージョンが生じる場合,それぞれの物体形状を同時に復元することは困難であった.この問題に対し,我々はこれまでに高速な境界追跡手法であるFast Level Set Methodを複数ステレオ距離画像に適用し,複数対象物体の三次元形状をオクルージョンに頑強に復元するシステムを構築している.本論文では,これまでに構築したシステムを8台の計算機からなるPCクラスタへ実装し,Fast Level Set Method処理の並列計算により,より高速な三次元形状の復元を実現する.また対象物体が移動する場合,その移動方向を予測し,移動体を処理する計算機の計算負荷を低減することで,移動体の正確な三次元形状を遅れなく復元する手法を提案する.更に,舞踊の測定実験により,対象が高速に移動しても,従来システムと比較してより正確な三次元形状の復元が可能であることを示す..
197. 内田 誠一, 迫江 博昭, 解析的DPマッチング(パターン認識と理解,画像の認識・理解論文), 電子情報通信学会論文誌. D, 情報・システム, Vol.90, No.8, pp.2137-2146, 2007.08, パターン認識・画像処理において多用される弾性マッチング手法に動的計画法によるマッチング,いわゆるDPマッチングがある.DPマッチングは離散化された最適化問題の幅優先探索に基づく解法であり,したがって探索の幅が非常に大きくなる問題に対しては適用困難であった.この問題を解決すべく本論文では解析的DPマッチングを提案する.本手法では,マッチングの評価に用いられる局所的な誤差関数を二次関数近似することで,幅優先探索なしに解析的に近似解(二次関数近似された問題の厳密解)を与えることができる.本論文では一次元パターンに対するマッチングアルゴリズムを導出し,更に実際の問題に適用し得ることをオンライン文字データを用いて実験的に検証する..
198. 森 明慧, 内田 誠一, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, 論理判定型DPマッチングによる類似区間検出, 電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition), Vol.90, No.8, pp.2147-2156, 2007.08, 本論文では,論理判定型DPマッチングによる類似区間検出手法について提案する.論理判定型DPマッチングとは,サポートと呼ばれる論理関数を基準として用いて二つのパターン間の非線形マッチングを行うアルゴリズムである.本手法の特徴は,パターン間に複数存在する類似区間の始端及び終端をマッチングの過程で最適に決定していく点にある.また,本手法の有効性を評価するための一応用として,ジェスチャの基本動作抽出についても検討する.実験の結果,本手法の基本的な性能を示すことができた..
199. 丹羽 亮, 岩村 雅一, 黄瀬 浩一, 内田 誠一, 大町 真一郎, 変量と不変量に基づく射影歪みからアフィン歪みへの補正, 画像の認識・理解シンポジウム(MIRU2007)論文集, pp.720-725, 2007.07, 利用者の利便性向上の観点から,デジタルカメラをスキャナの代わりに用いて文書画像処理を行う試みが 盛んに研究されている.しかし,既存の文書画像処理技術の多くはスキャナで取得した文書画像を対象としているた め,デジタルカメラで斜めから撮影した文書画像には適用できない.このような場合,文書画像に生じた射影歪みを 補正し,スキャナで取得したかのような真正面の文書画像を得る必要がある.本稿では,紙面の傾きに応じて値が変 化する「変量」と変化しない「不変量」を組み合わせた文書画像の傾き補正手法を提案する.提案手法は,従来手法 のように撮影方法やレイアウトに強い制約を用いないため,これまで補正不可能であった文書画像を復元することが できる.実験により,射影歪みを受けた文書画像をアフィン歪み程度に復元できることを確認した..
200. 岩村雅一, 黄瀬浩一, 大町真一郎, 内田誠一, 付加情報の利用による認識率100%の実現―誤りのないパターン認識手法の理論と実践―, マツダ財団研究報告書(科学技術振興関係), Vol.19, pp.203-210, 2007.06.
201. 黄瀬 浩一, 大町 真一郎, 内田 誠一, 情報埋め込みによる高精度文字パターン認識--ユニバーサル・パターンの実現に向けて, 画像ラボ, Vol.18, No.4, pp.18-22, 2007.04.
202. マロン クリストファー, 内田 誠一, 鈴木 昌和, DPマッチングによる接触文字分離, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.605, pp.13-18, 2007.03, Ideally, an OCR system would partition the set of connected black components on a page into subsets representing individual characters. However, this approach is inadequate if some component partially belongs to several touching characters. We present a DP matching-based method that cuts such a component apart, given a hypothetical classification for the leftmost part. Our method produces better quality cuts than well-known methods, particularly in mathematical expressions, where characters are often slanted and may touch in widely varying configurations. A good cut allows single-character recognition techniques to be applied to the cut part and the residual image, in order to judge whether the hypothetical classification was correct..
203. 田中 一弘, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, データ埋め込みペン実現に向けたデータ抽出精度の検証, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.605, pp.73-78, 2007.03, 本研究では,情報埋め込み技術を用いることで,紙とペンで生成される手書きパターンの価値を高めることを日標とする.本報告では,実際にインクドツトを埋め込んだパターンを用いて,その画像からどの程度の精度でデータを抽出できるかを検証する.また,その際に必要となる情報が埋め込まれている部分の検出方法とデータを復元するための手法について述べる..
204. 二矢川 和也, 内田 誠一, 迫江 博昭, パターンマッチングにおける特徴量の非同期化の影響 : オンライン文字認識を例として, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.606, pp.37-42, 2007.03, オンライン文字認識では,パターンマッチングが広く用いられる.従来この方式では,各時刻における特徴量は,一括してベクトル表現され同期してマッチングされる.本発表では各時刻の特徴量を非同期化させながら,マッチングを行うことで起こりえる影響について考察する.また従来のDPマッチングアルゴリズムを拡張し,非同期型DPマッチングを扱えるようにしたものを提案する.実験の結果,局所的に非同期性を導入することで従来の同期型マッチングよりも高い認識率を得ることができた..
205. 酒井 恵, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 変量と不変量の組合わせによる文書画像の傾き補正, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.605, pp.97-102, 2007.03, 不変量と変量を組み合わせた幾何変形推定法を提案し,文書画像の傾きすなわち回転変形の推定への応用を試みる.まずあらかじめ様々な文字フォントを回転させながら回転可変量(例えば,文字の外接矩形の面積)の変化を測定し,これを回転不変量(例えば,文字凸包内の黒画素と白画素の面積)と共に事例として記憶しておく.そして補正したい画像の各連結成分(多くは単文字に相当)から算出した回転不変量により事例を呼び出し,同じく算出した回転変量から文字の回転角を得る.本手法には,文字が直線的な部分形状と並びを持つという,従来一般に利用されてきた仮定が不要になる.文書画像44サンプルを用いて,簡単な傾き推定実験を行ったところ,25サンプルにおいて誤差1度以下,42サンプルにおいて誤差2度以下という精度を得た..
206. 馬場 大樹, 内田 誠一, 迫江 博昭, 座標値予測を導入したDPマッチングによるオンライン文字認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.606, pp.43-48, 2007.03, オンライン文字認識において,座標値予測を導入したDPマッチングを提案した.この手法では物理的な意味の異なる特徴量である座標特徴と方向特徴を統一する方法で扱っている.この統一は特徴予測技術によって方向特徴の相違度を座標特徴の相違度に変換することで行われる.従来のDPマッチングは,2つの特徴のバランスをとるために手間のかかる加重の最適化を必要とする.認識実験の結果,座標値予測DPマッチングは従来のDPマッチングによる認識率を上回った..
207. 森 明慧, 内田 誠一, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, 統計的手法を導入した論理判定型DPマッチングによる類似区間検出, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.606, pp.31-36, 2007.03, 本報告では,統計的手法を導入した論理判定型DPマッチングによる類似区間検出手法を提案する.論理判定型DPマッチングとは,サポートと呼ばれる論理関数を基準として用いて2つのパターン問の非線形マッチングを行うアルゴリズムであり,パターン間に複数存在する類似区間を同時に検出できるという特長を持つ.この論理判定型DPマッチングに統計的手法を導入することで,パターンの変動のしやすさを考慮したより高精度な類似区間検出が可能になると考えられる.また実際の応用例として,本報告では本手法を用いたジェスチャの基本動作抽出についても検討する.実際に統計的手法の導入による効果を検証するための実験を行った結果,本手法の有効性を示すことができた..
208. 岩村 雅一, 内田 誠一, 大町 真一郎, 黄瀬 浩一, 付加情報を用いるパターン認識(パターン認識), 電子情報通信学会論文誌. D, 情報・システム, Vol.90, No.2, pp.460-470, 2007.02, 本論文ではパターンが属するクラスの情報(付加情報)をパターンと同時に識別器に入力し,パターンと付加情報から矛盾のない答を導くことで誤認識を防ぐ方式を検討する.この方式では付加情報の情報量が増えれば増えるほど認識率は100%に近づく.そのため,従来のパターン認識のように,いかに認識性能を向上させるかではなく,ある認識率を達成するために必要な付加情報の情報量をいかに小さくできるかが課題となる.本論文では付加情報の割当方と認識性能の関係を導き,実験によりデモンストレーションする..
209. 内田誠一, DPマッチング概説 〜 基本と様々な拡張 〜, 電子情報通信学会技術研究報告(特別講演), PRMU2006-166, 2006.12.
210. 内田 誠一, DPマッチング概説 : 基本と様々な拡張, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.428, pp.31-36, 2006.12, 弾性マッチングの一種であるDPマッチングは,開発されて既に30年以上経った現在でも,パターン認識・画像処理の基本技術として多用されている.本稿では,1次元パターン間のDPマッチング,1次元と2次パターンのDPマッチング,2次元パターン間のDPマッチングを述べた後,いくつかの高速化手法,ならびに学習理論との組み合わせについて紹介する..
211. 天野 敏之, 岩村 雅一, 岡部 孝弘, 加藤 毅, 玉木 徹, 内田 誠一, 内田 誠一, MIRU2006若手プログラム報告, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.429, pp.73-84, 2006.12, 2006年7月,仙台市青年文化センターにて画像の認識・理解シンポジウムMIRU2006が開催された.その併設イベントとして,若手研究者の活性化および相互交流を図ることを目的とした「若手プログラム-突撃インタビュー!先人の成功と失敗に学ぼう」を開催した.本稿ではまず企画概要を述べた後,若手研究者が先輩研究者に対して行ったインタビューについてダイジェスト形式で報告する..
212. 黄瀬 浩一, Masakazu IWAMURA, Yoshio FURUYA, Shinichiro OMACHI, Seiichi UCHIDA, Better Decision Boundary for Pattern Recognition with Supplementary Information, IEICE Technical Report, Vol.106, No.PRMU-376, pp.159-164, 2006.11.
213. 森 明慧, 内田 誠一, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, 実体を伴うプロアクティブヒューマンインタフェースのためのジェスチャの早期認識・予測に関する検討, 日本ロボット学会誌 = Journal of Robotics Society of Japan, 10.7210/jrsj.24.954, Vol.24, No.8, pp.954-963, 2006.11, This paper concerns three topics for realizing embodied“proactive”human interface, where a humanoid is used as an interface capable of making some reaction against to user's gesture input in advance to the termination of the gesture. The first topic is early recognition of gestures: the recognition result of a gesture is provided at the beginning part of the gesture. The second topic is motion prediction: the subsequent posture of the person who makes a gesture is predicted by using the result of early recognition. The third topic is a network model constructed for improving the performance of early recognition and motion prediction. The effectiveness of these methods was shown by experimental results..
214. 古谷 嘉男, 岩村 雅一, 黄瀬 浩一, 大町 真一郎, 内田 誠一, 付加情報を用いるパターン認識における識別境界移動の効果 : 正規分布に従う人工サンプルを用いた場合の実験的検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.301, pp.53-58, 2006.10, 通常のパターン認識とは異なる,付加情報を用いるパターン認識という新しい枠組みが提案されている.これは,通常のパターンと同時にそれを補助する情報(付加情報)をパターンとは別に用意し,それらを同時に用いることにより誤認識率を減少させる方式である.通常のパターン認識では,ベイズ識別境界が誤認識率を最小にする.それに対して,付加情報を用いるパターン認識では,識別境界をベイズ識別境界から移動することにより,誤認識率が減少することが実験により確認されている.しかし,この実験では,実際の文字データを用いているため,ベイズ識別境界はその推定値でしかなく,厳密な意味で識別境界を移動すると誤認識率が減少する場合があるという存在証明になっていない.この問題を解決するため,ベイズ識別境界が既知である人工サンプルを作成し,誤認識率が減少する場合があることを改めて実験により確認した..
215. 内田 誠一, 森 明慧, 大政 紘映, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, 実体を伴うプロアクティブインタフェースによる双方向遠隔コミュニケーション実験, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.106, No.296, pp.13-18, 2006.10, 双方向遠隔コミュニケーションのために,プロアクティブインタフェースの開発を試みる.このインタフェースには,次のような三つの特徴がある.第一に,テキストや画像といった仮想メディアだけではなくロボット技術を利用することで,その身体性を活用したコミュニケーションを可能にし,実世界での対面コミュニケーションとの乖離を低減できる.第二に,多視点ステレオ計測システムの利用により,キーボードやジョイスティックなどを用いない自然なコミュニケーションの場を提供可能である.そして第三に,先回り(プロアクティブ)処理に基づいて,遅延などコミュニケーションを阻害する様々な問題を緩和できる.本報告ではプロアクティブインタフェースの実現のための3つの要素技術-提示技術,入力技術,プロアクティブ技術-について,それらの概要を述べる.さらにそれら要素技術を用いて双方向遠隔コミュニケーション実験を行った結果について報告する..
216. 内田 誠一, 森 明慧, 大政 紘映, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, 実体を伴うプロアクティブインタフェースによる双方向遠隔コミュニケーション実験, 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション, Vol.106, No.298, pp.13-18, 2006.10, 双方向遠隔コミュニケーションのために,プロアクティブインタフェースの開発を試みる.このインタフェースには,次のような三つの特徴がある.第一に,テキストや画像といった仮想メディアだけではなくロボット技術を利用することで,その身体性を活用したコミュニケーションを可能にし,実世界での対面コミュニケーションとの乖離を低減できる.第二に,多視点ステレオ計測システムの利用により,キーボードやジョイスティックなどを用いない自然なコミュニケーションの場を提供可能である.そして第三に,先回り(プロアクティブ)処理に基づいて,遅延などコミュニケーションを阻害する様々な問題を緩和できる.本報告ではプロアクティブインタフェースの実現のための3つの要素技術-提示技術,入力技術,プロアクティブ技術-について,それらの概要を述べる.さらにそれら要素技術を用いて双方向遠隔コミュニケーション実験を行った結果について報告する..
217. 内田 誠一, 森 明慧, 大政 紘映, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, 実体を伴うプロアクティブインタフェースによる双方向遠隔コミュニケーション実験, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.106, No.300, pp.31-36, 2006.10, 双方向遠隔コミュニケーションのために,プロアクティブインタフェースの開発を試みる.このインタフェースには,次のような三つの特徴がある.第一に,テキストや画像といった仮想メディアだけではなくロボット技術を利用することで,その身体性を活用したコミュニケーションを可能にし,実世界での対面コミュニケーションとの乖離を低減できる.第二に,多視点ステレオ計測システムの利用により,キーボードやジョイスティックなどを用いない自然なコミュニケーションの場を提供可能である.そして第三に,先回り(プロアクティブ)処理に基づいて,遅延などコミュニケーションを阻害する様々な問題を緩和できる.本報告ではプロアクティブインタフェースの実現のための3つの要素技術-提示技術,入力技術,プロアクティブ技術-について,それらの概要を述べる.さらにそれら要素技術を用いて双方向遠隔コミュニケーション実験を行った結果について報告する..
218. 黄瀬 浩一, 大町 真一郎, 内田 誠一, 岩村 雅一, ディジタルカメラによる文字・文書の認識・理解, 電子情報通信学会誌, Vol.89, No.9, pp.836-841, 2006.09, ディジタルスチルカメラやビデオカメラの普及と発展に伴って,撮影した画像内の文字・文書を情報処理に利用したいという要求が高まっている.本稿では,このようなカメラを用いた文字・文書の認識・理解を通して,我々は何を得ることができるのか,また実現には何が問題であり,現在どのような取組みがなされているのかについて解説する.加えて,残された研究課題について触れるとともに,エーザインタフェースへの適用の視点から筆者らが進めている新しい試みについても紹介する..
219. 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, カメラによる文字認識のためのカテゴリー情報の埋込に関する検討(画像認識,コンピュータビジョン), 電子情報通信学会論文誌. D, 情報・システム, Vol.89, No.2, pp.344-352, 2006.02, 本研究は,バーコードと同程度の精度で三次元実環境中の文字パターンを認識することを目標としている.実環境中の文字パターンは,撮影状況により様々なひずみ,例えば射影変換ひずみを受ける.このため,通常の文字認識手法の延長線上でこの目標を達成しようとしても,相当の困難が予想される.そこで本論文では,文字そのものに機械可読性を補強するような情報を埋め込む方式を検討する.具体的には,文字画像に対し,しま模様状のパターンを埋め込む.このパターンを構成する各しまの幅から計算される複比は,文字パターンがどのように射影変換ひずみを受けてたとしても常に一定値となる.したがって,カテゴリーと複比の値をあらかじめ対応づけておけば,抽出された複比を識別の手掛りとして認識時に利用できる.シミュレーション実験の結果,複比と文字形状情報を併用することで,射影変換ひずみを受けても非常に高い認識精度が得られることが分かった..
220. マロン クリストファー, 鈴木 昌和, 内田 誠一, サポートベクターマシンによる数学記号認識, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.105, No.612, pp.49-54, 2006.02, Mathematical formulas challenge an OCR system with a range of similar-looking characters whose bold, calligraphic, and italic varieties must be recognized distinctly, though the fonts to be used in an article are not known in advance. We describe the use of support vector machines (SVM) to learn and predict about 300 classes of styled characters and symbols..
221. マロン クリストファー, 鈴木 昌和, 内田 誠一, サポートベクターマシンによる数学記号認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.105, No.614, pp.49-54, 2006.02, Mathematical formulas challenge an OCR system with a range of similar-looking characters whose bold, calligraphic, and italic varieties must be recognized distinctly, though the fonts to be used in an article are not known in advance. We describe the use of support vector machines (SVM) to learn and predict about 300 classes of styled characters and symbols..
222. 宮崎 洋光, 内田 誠一, 迫江 博昭, フレーム間マッチングを導入した Mosaicing-by-Recognition 法の検討, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.105, No.613, pp.1-6, 2006.02, 著者らは,動画像中のテキスト認識を目的として,手ぶれ変動の補償,複数フレームの接合,ならびに認識を一括して実行する手法を検討してきた.本手法では,標準文字パターンを介して,変動した入力フレーム列を最適に補償しながら,認識およびフレーム接合を行う.本報告はその続報であり,主に認識およびモザイキングの性能向上を目的としたフレーム間マッチングの導入に関する検討を述べる..
223. 宮崎 洋光, 内田 誠一, 迫江 博昭, フレーム間マッチングを導入した Mosaicing-by-Recognition 法の検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.105, No.615, pp.1-6, 2006.02, 著者らは,動画像中のテキスト認識を目的として,手ぶれ変動の補償,複数フレームの接合,ならびに認識を一括して実行する手法を検討してきた.本手法では,標準文字パターンを介して,変動した入力フレーム列を最適に補償しながら,認識およびフレーム接合を行う.本報告はその続報であり,主に認識およびモザイキングの性能向上を目的としたフレーム間マッチングの導入に関する検討を述べる..
224. 田中 一弘, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 手書きパターンへの情報埋め込みと情報抽出, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.105, No.613, pp.61-66, 2006.02, 本研究では,情報埋め込み技術を用いることで,紙とペンで生成される手書きパターンの価値を高めることを目標とする.本報告ではそのために想定しているハードウエア,ならびに情報埋め込み・抽出手段,応用先について述べる.さらに,情報抽出の際の中心的問題になる筆順復元について検討する.この筆順復元については,情報が埋め込みされているという本手書きパターン特有の状況を活用することで,高精度化が可能であることを示す..
225. 田中 一弘, 内田 誠一, 岩村 雅一, 大町 真一郎, 黄瀬 浩一, 手書きパターンへの情報埋め込みと情報抽出, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.105, No.615, pp.61-66, 2006.02, 本研究では,情報埋め込み技術を用いることで,紙とペンで生成される手書きパターンの価値を高めることを目標とする.本報告ではそのために想定しているハードウエア,ならびに情報埋め込み・抽出手段,応用先について述べる.さらに,情報抽出の際の中心的問題になる筆順復元について検討する.この筆順復元については,情報が埋め込みされているという本手書きパターン特有の状況を活用することで,高精度化が可能であることを示す..
226. 内田 誠一, 迫江 博昭, 解析的DPマッチングによるパターン認識, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.105, No.612, pp.43-48, 2006.02, 本報告では,パターン認識・画像処理における最も基本的な道具の1つである,動的計画法(dynamic programming)による弾性マッチング手法-DPマッチング-について,新たな方式を提案する.すなわち,従来のDPマッチングが離散的最適化問題の幅優先探索による解法であるのに対し,本報告で提案する解析的DPマッチングは,問題を一部連続化して捉えることで,幅優先探索なしに厳密解を解析的に与えることができる.したがって,探索の幅が非常に大きくなっていた問題に対し有効であると期待される.本報告では解析的DPマッチングのアルゴリズムを導出し,それが実際のパターンマッチング問題に適用しうることをオンライン文字データを用いて実験的に検証する..
227. 内田 誠一, 迫江 博昭, 解析的DPマッチングによるパターン認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.105, No.614, pp.43-48, 2006.02, 本報告では,パターン認識・画像処理における最も基本的な道具の1つである,動的計画法(dynamic programming)による弾性マッチング手法-DPマッチング-について,新たな方式を提案する.すなわち,従来のDPマッチングが離散的最適化問題の幅優先探索による解法であるのに対し,本報告で提案する解析的DPマッチングは,問題を一部連続化して捉えることで,幅優先探索なしに厳密解を解析的に与えることができる.したがって,探索の幅が非常に大きくなっていた問題に対し有効であると期待される.本報告では解析的DPマッチングのアルゴリズムを導出し,それが実際のパターンマッチング問題に適用しうることをオンライン文字データを用いて実験的に検証する..
228. 三苫 寛人, 内田 誠一, 迫江 博昭, 部分空間法とDPマッチングに基づくオンライン文字認識手法, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.105, No.613, pp.123-128, 2006.02, これまでに筆者らは,オンライン文字認識のために,弾性マッチングの結果として得られる差分ベクトルを用いた2次識別関数法を検討してきた.この差分ベクトルは文字の大局的特徴を表現しており,これを用いた2次識別関数法は,弾性マッチング距離をそのまま用いる認識手法において問題となっていた合せ過ぎによる誤認識を低減でき,高い認識精度を実現できた.一方で,学習不足による改悪も見られた.そこで,本報告では,合せ過ぎによる誤認識を防ぎつつ,この問題を解決する手法として,部分空間法に基づく認識手法を提案する.UNIPENデータベースのオンライン数字データを用いた認識実験により従来法よりも高い認識率が得られ,本手法の有効性を確かめられた..
229. 三苫 寛人, 内田 誠一, 迫江 博昭, 部分空間法とDPマッチングに基づくオンライン文字認識手法, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.105, No.615, pp.123-128, 2006.02, これまでに筆者らは,オンライン文字認識のために,弾性マッチングの結果として得られる差分ベクトルを用いた2次識別関数法を検討してきた.この差分ベクトルは文字の大局的特徴を表現しており,これを用いた2次識別関数法は,弾性マッチング距離をそのまま用いる認識手法において問題となっていた合せ過ぎによる誤認識を低減でき,高い認識精度を実現できた.一方で,学習不足による改悪も見られた.そこで,本報告では,合せ過ぎによる誤認識を防ぎつつ,この問題を解決する手法として,部分空間法に基づく認識手法を提案する.UNIPENデータベースのオンライン数字データを用いた認識実験により従来法よりも高い認識率が得られ,本手法の有効性を確かめられた..
230. 大町 真一郎, 岩村 雅一, 内田 誠一, 黄瀬 浩一, 高精度実環境文字認識のための面積比による付加情報埋め込み, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.105, No.613, pp.67-72, 2006.02, 環境中の文字をディジタルカメラを入力デバイスとして高精度に認識するために,文字画像と同時に認識補助のための付加情報を提示する方法が検討されている.付加情報は,幾何学的変換に対してロバストに抽出できることが要求される.本報告では,面積比を利用した付加情報提示手法を提案する.面積比はアフィン変換に不変であり,アフィン変換を受けた環境においても誤りなく抽出されることが期待される.実際に付加情報を埋め込んだ文字パターンを作成し,提案手法の有効性と可能性について議論する..
231. 大町 真一郎, 岩村 雅一, 内田 誠一, 黄瀬 浩一, 高精度実環境文字認識のための面積比による付加情報埋め込み, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.105, No.615, pp.67-72, 2006.02, 環境中の文字をディジタルカメラを入力デバイスとして高精度に認識するために,文字画像と同時に認識補助のための付加情報を提示する方法が検討されている.付加情報は,幾何学的変換に対してロバストに抽出できることが要求される.本報告では,面積比を利用した付加情報提示手法を提案する.面積比はアフィン変換に不変であり,アフィン変換を受けた環境においても誤りなく抽出されることが期待される.実際に付加情報を埋め込んだ文字パターンを作成し,提案手法の有効性と可能性について議論する..
232. 内田 誠一, 画像の弾性マッチング : パターン認識と画像工学の一接点, 情報処理学会研究報告. AVM,[オーディオビジュアル複合情報処理], Vol.50, No.98, pp.1-6, 2005.10, 本チュートリアルでは, 画像の弾性マッチング法について解説する. 弾性マッチングは, 画像工学やパターン認識の分野における基本技術である. 例えば, 画像工学の分野においては動画像圧縮時の動き補償に利用される. 一方, パターン認識の分野においては, 2画像間の類似度を評価する際に利用される. 弾性マッチングは, ゴム膜マッチングとも呼ばれ, 直感的には, 一方の画像を変形させながらもう一方の画像に近づける方法である. 数学的には, 2画像間の画素対応関係を定める2次元-2次元写像関数の最適化問題として定式化される. この写像関数については様々なモデルが提案されている. これらモデルを概観すると共に, その最適化問題がどのように解かれるかについて解説する..
233. 大政 紘映, 倉爪 亮, 内田 誠一, 谷口 倫一郎, 長谷川 勉, プロアクティブヒューマンインタフェースの研究 - 第4報 単眼カメラと2次元距離場を用いた人間動作の計測と再現-, 第23回日本ロボット学会学術講演会, 2005.09.
234. 森 明慧, 内田 誠一, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, ジェスチャの早期認識・予測ならびにそれらの高精度化のためのネットワークモデルに関する検討, 画像の認識・理解シンポジウム, pp.1058-1065, 2005.07, 本論文ではジェスチャの早期認識,及びその認識結果に基づいた動作予測について検討する.早期認識とはジェスチャ入力の初期段階における識別を可能とするものである.一方,動作予測とはジェスチャ動作者の数フレーム後の姿勢を推定するものである.さらに,本研究ではジェスチャ間の関係によって構築されるネットワークに対して上記の手法を適用することを検討する.ネットワークを用いることで,早期認識および動作予測がもつ原理的な限界による影響を抑えることが可能となる.本研究では比較的単純なアプローチによって上記手法の基本的な性質を明らかにする.最後に,これらの実験結果を踏まえ,ヒューマンインタフェースの開発など,今後さらに検討を進めて行くための適切な方針について展望する..
235. 蔡 文杰, 内田 誠一, 迫江 博昭, 部首単位標準パターンとキューブサーチに基づく筆順フリーなオンライン文字認識アルゴリズム(画像認識, コンピュータビジョン), 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理, Vol.88, No.7, pp.1187-1195, 2005.07, グラフサーチにより最適画間対応を定めて筆順自由性を実現するオンライン文字認識法であるキューブサーチ法の動作速度と認識精度の改善を検討した.筆順変動を部首内の変動と部首間の変動に分離して, 部首単位標準パターンに基づく2段階のキューブサーチアルゴリズムを構成した.併せて, 処理量最小化条件を含む部首単位分割の指針を示した.教育漢字を対象とする画数固定条件での認識実験により, 速度, 精度両面での改善が確認され, 併せて, 処理量最小化部首分割条件の妥当性が確認された..
236. 黄瀬 浩一, 大町 真一郎, 内田 誠一, 岩村 雅一, カメラを用いた文字認識・文書画像解析の現状と課題, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.104, No.742, pp.85-90, 2005.03, デジタルカメラの小型化, 高解像度化, 一般化に伴い, これを入力手段として用いた文字認識・文書画像解析への期待が高まりつつある.本稿では, デジタルカメラを用いた文字認識・文書画像解析について現在の代表的な技術を俯瞰するとともに, バーコードなどの関連技術との比較によって, 文字認識, 文書画像解析の立場や将来への課題を浮き彫りにする.また, 将来に向けた試みの一つとして, 著者らが「バーコードリーダ並みに手軽で高精度な文字認識」を目指して行っている研究「複比を用いた文字への情報埋め込み」の一端についても紹介する..
237. 黄瀬 浩一, 大町 真一郎, 内田 誠一, 岩村 雅一, カメラを用いた文字認識・文書画像解析の現状と課題, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.104, No.740, pp.85-90, 2005.03, デジタルカメラの小型化, 高解像度化, 一般化に伴い, これを入力手段として用いた文字認識・文書画像解析への期待が高まりつつある.本稿では, デジタルカメラを用いた文字認識・文書画像解析について現在の代表的な技術を俯瞰するとともに, バーコードなどの関連技術との比較によって, 文字認識, 文書画像解析の立場や将来への課題を浮き彫りにする.また, 将来に向けた試みの一つとして, 著者らが「バーコードリーダ並みに手軽で高精度な文字認識」を目指して行っている研究「複比を用いた文字への情報埋め込み」の一端についても紹介する..
238. 原 学, 内田 誠一, 迫江 博昭, ステレオ画像圧縮のための視差補償法に関する検討, 九州大学大学院システム情報科学紀要, 10.15017/1516209, Vol.10, No.1, pp.57-62, 2005.03, In this paper, we describe a data compression technique for stereo-pairs using pixel-based disparity compensation (DC). The bit-rate of prediction residual of the proposed pixel-based DC is lower than that of block-based DC, which has been used commonly. Although the bit-rate of disparity becomes high on the pixel-based DC, we can relax this problem by imposing several restrictions on DC. It is also shown that the performance of the proposed technique can be improved by the following two modifications. Firstly, previous pixel prediction is selectively used around occlusion areas. Secondly, instead of pixels, blocks of one pixel width are employed as a unit of DC. The effectiveness of the proposed technique is observed through experiments..
239. 宮崎 洋光, 内田 誠一, 迫江 博昭, 動画像中のテキスト認識を目的としたビデオモザイキング手法, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.104, No.742, pp.97-102, 2005.03.
240. 宮崎 洋光, 内田 誠一, 迫江 博昭, 動画像中のテキスト認識を目的としたビデオモザイキング手法, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.104, No.740, pp.97-102, 2005.03.
241. 宮崎 洋光, 内田 誠一, 迫江 博昭, 動画像中のテキスト認識を目的としたビデオモザイキング手法, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.104, No.742, pp.97-102, 2005.03, 本報告では, 動画像を用いたテキスト認識を目的として, 手ぶれ変形の補償, 複数フレームの接合(モザイキング), ならびに認識を一括して実行する手法を提案する.本手法は様々な変形をパラメータ化し, それをsegmentation-by-recognition的な手法で同時最適化することで, 最適変形補償ならびに最適フレーム接合を可能にしている.静止画像ではなく動画像を用いることで, テキストの長さの制約を排除できると考えられる.しかし問題点として, 撮影中の手ぶれによる文字の変形, ならびに複数フレームへの分断への対処が考えられる.予備的な実験の結果, 様々な手ぶれを起こした場合でも90%前後の文字認識率が得られ, 本手法の有効性が確認できた..
242. 宮崎 洋光, 内田 誠一, 迫江 博昭, 動画像中のテキスト認識を目的としたビデオモザイキング手法, 電子情報通信学会技術研究報告, Vol.104, No.740, pp.97-102, 2005.03, 本報告では, 動画像を用いたテキスト認識を目的として, 手ぶれ変形の補償, 複数フレームの接合(モザイキング), ならびに認識を一括して実行する手法を提案する.本手法は様々な変形をパラメータ化し, それをsegmentation-by-recognition的な手法で同時最適化することで, 最適変形補償ならびに最適フレーム接合を可能にしている.静止画像ではなく動画像を用いることで, テキストの長さの制約を排除できると考えられる.しかし問題点として, 撮影中の手ぶれによる文字の変形, ならびに複数フレームへの分断への対処が考えられる.予備的な実験の結果, 様々な手ぶれを起こした場合でも90%前後の文字認識率が得られ, 本手法の有効性が確認できた..
243. 三苫 寛人, 内田 誠一, 迫江 博昭, 固有変形を用いたオンライン文字認識手法の改良, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.104, No.742, pp.47-52, 2005.03, 筆者らはカテゴリ内文字変動を表現する固有変形を用いたオンライン文字認識手法を検討してきた.この方式では, 入力パターンとあるカテゴリの標準パターンとのマッチングがそのカテゴリの固有変形からどの程度逸脱しているかを評価する.本報告はその続報であり, 主に(i)変形逸脱量の評価形式, (ii)変形表現形式の2点について, 改善ならびに検討について述べる.また, UNIPENデータベースのオンライン数字データを用いた認識実験により最高認識率97.95%が得られ, 本手法の有効性を確かめられた..
244. 三苫 寛人, 内田 誠一, 迫江 博昭, 固有変形を用いたオンライン文字認識手法の改良, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.104, No.740, pp.47-52, 2005.03, 筆者らはカテゴリ内文字変動を表現する固有変形を用いたオンライン文字認識手法を検討してきた.この方式では, 入力パターンとあるカテゴリの標準パターンとのマッチングがそのカテゴリの固有変形からどの程度逸脱しているかを評価する.本報告はその続報であり, 主に(i)変形逸脱量の評価形式, (ii)変形表現形式の2点について, 改善ならびに検討について述べる.また, UNIPENデータベースのオンライン数字データを用いた認識実験により最高認識率97.95%が得られ, 本手法の有効性を確かめられた..
245. 野村 明弘, 内田 誠一, 鈴木 昌和, 英文数学文書の正解付き文字・記号画像データベース, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.104, No.741, pp.37-42, 2005.03.
246. 野村 明弘, 内田 誠一, 鈴木 昌和, 英文数学文書の正解付き文字・記号画像データベース, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.104, No.739, pp.37-42, 2005.03.
247. 野村 明弘, 内田 誠一, 鈴木 昌和, 英文数学文書の正解付き文字・記号画像データベース, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.104, No.741, pp.37-42, 2005.03, 英文数学文書の正解付き文字・記号画像データベース(InftyCDB-1)について, その仕様と, 文字および単語単位の解析結果について述べる.本データベースでは, 文書中のすべての文字ならびに記号それぞれについて, 文字種やフォント, 異常文字正常文字の区別等の正解情報が付与されている.さらに数式中の文字・記号については, その数式を木構造表現するために必要十分な情報も付与されている.また、単語データベースや数式画像データベースとしての利用も容易となるように工夫している.本データベースは一般公開される予定である..
248. 野村 明弘, 内田 誠一, 鈴木 昌和, 英文数学文書の正解付き文字・記号画像データベース, 電子情報通信学会技術研究報告, Vol.104, No.739, pp.37-42, 2005.03, 英文数学文書の正解付き文字・記号画像データベース(InftyCDB-1)について, その仕様と, 文字および単語単位の解析結果について述べる.本データベースでは, 文書中のすべての文字ならびに記号それぞれについて, 文字種やフォント, 異常文字正常文字の区別等の正解情報が付与されている.さらに数式中の文字・記号については, その数式を木構造表現するために必要十分な情報も付与されている.また、単語データベースや数式画像データベースとしての利用も容易となるように工夫している.本データベースは一般公開される予定である..
249. 岩村 雅一, 内田 誠一, 大町 真一郎, 黄瀬 浩一, 認識が与える情報量 : 認識率100%まであと何ビット?, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.104, No.742, pp.35-40, 2005.03, パターン認識の究極の目標は認識率100%の達成であるが, 誤認識が全く起こらない識別器の設計は容易ではない.本報告では認識誤りを補うために正解クラスに関する情報(付加情報)をパターンとは別に用意し, パターンと付加情報を識別器に同時に与えることで認識率100%かつリジェクト率0%を達成する方式を提案する.実験の結果, 印刷文字ではオープン実験で4ビット, クローズ実験で1ビットの情報の付加で達成できることが示された.このような情報量は認識率や認識後に残る不確かさとは別の性質を持ち, 識別器の新たな評価基準となり得る..
250. 岩村 雅一, 内田 誠一, 大町 真一郎, 黄瀬 浩一, 認識が与える情報量 : 認識率100%まであと何ビット?, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.104, No.740, pp.35-40, 2005.03, パターン認識の究極の目標は認識率100%の達成であるが, 誤認識が全く起こらない識別器の設計は容易ではない.本報告では認識誤りを補うために正解クラスに関する情報(付加情報)をパターンとは別に用意し, パターンと付加情報を識別器に同時に与えることで認識率100%かつリジェクト率0%を達成する方式を提案する.実験の結果, 印刷文字ではオープン実験で4ビット, クローズ実験で1ビットの情報の付加で達成できることが示された.このような情報量は認識率や認識後に残る不確かさとは別の性質を持ち, 識別器の新たな評価基準となり得る..
251. Kazuhiko Yamamoto, Shinji Tsuraoka, Hiromichi Fujisawa, Toyohide Watanabe, Hiroshi Murase, Yoshimasa Kimura, Fumitaka Kimura, Masaki Nakagawa, Ryuichi Oka, Norihiro Hagita, Satoshi Naoi, Yasuto Ishitani, Keiji Yamada, Daisuke Nishiwaki, Yoshihiko Hamamoto, Toru Wakahara, Koichi Kise, Shin'ichiro Omachi, Seiichi Uchida, Foreword: Special section on document image understanding and digital documents, IEICE Transactions on Electronics, Vol.E88-C, pp.1779-1780, 2005.01.
252. 奥村 大樹, 内田 誠一, 迫江 博昭, オンライン手書き文字認識HMMにおける座標情報と方向情報の利用法と効果, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.104, No.523, pp.25-30, 2004.12, 本稿では,HMMに基づくオンライン手書き文字(特に漢字)認識の新たな手法として,"線分始点座標+方向情報出力型HMM"を提案する.HMMをオンライン手書き文字認識に適用する場合,定常性が間題になる.HMMはパターンの特徴を"状態"に対応させるが,この状態は特微量に関する何らかの定常性を仮定している.文字を線分近似して考えると,直線部分では方向情報はほぼ一定で,定常状態と見なせるが,座標情報は時々刻々と変化するため定常とは見なせない.本手法では,線分の始点を過渡状態として,そこでは座標情報を1回だけ出力し,線分内は定常状態としてそこでは固有の方向情報を出力する形のHMMを提案する.さらに,筆順変動を伴う多画文字を扱うために,最適画対応サーチアルゴリズムであるキューブサーチ法にこのHMMを埋め込んだ手法を提案する.10画漢字を対象とした認識実験により,本手法の有効性を確認した..
253. 三苫 寛人, 内田 誠一, 迫江 博昭, 弾性マッチングと固有変形を用いたオンライン文字認識(画像情報)(次世代移動体通信システム), 情報処理学会論文誌, Vol.45, No.12, pp.2845-2855, 2004.12, DPマッチングなど,いわゆる弾性マッチングに基づくオンライン文字認識においては,合わせ過ぎによる誤認識が発生する.たとえば,入力パターンが"1"であっても,マッチングによって水平部が非線形伸縮しながら対応付けられた結果,"7"に誤認識される場合がある.本論文では,こうした誤認識の低減手法を提案する.合わせ過ぎの発生原因としては,弾性マッチングが本来そのカテゴリでは起こりえないような変形も補償対象としていることがあげられる.そこで本手法では,あらかじめ各カテゴリに生じやすい変形(固有変形)を統計的手法により求めておき,認識の際のマッチングの結果が固有変形からどれぐらい逸脱しているかを評価する.その逸脱量が大きければ,そのマッチングにより合わせ過ぎが起きていると判断できる.オンライン数字データを用いた認識実験により,本手法の有効性を確認した..
254. 内田 誠一, 森 明慧, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, 動作の早期認識およびその予測への応用に関する検討, 電子情報通信学会技術研究報告. HIP, ヒューマン情報処理, Vol.104, No.449, pp.7-12, 2004.11, 本報告では,ジェスチャの早期認識,およびその認識処理を利用した動作予測の2点について検討する.早期認識とはジェスチャの終了を待たずになるべく早い段階でそれが何のジェスチャであるかを識別するものである.一方,動作予測とはユーザ(ジェスチャ行為者)の数フレーム後の状態を推定するものである.本報告では比較的単純なアプローチにより以上2つの課題を検討しながら,それらの原理的な限界を明らかにする.さらに,そうした限界を踏まえた上で,プロアクティブヒューマンインタフェースの開発等,今後さらに検討を進めて行くための適切な方針について展望する..
255. 内田 誠一, 森 明慧, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, 動作の早期認識およびその予測への応用に関する検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.104, No.447, pp.7-12, 2004.11, 本報告では,ジェスチャの早期認識,およびその認識処理を利用した動作予測の2点について検討する.早期認識とはジェスチャの終了を待たずになるべく早い段階でそれが何のジェスチャであるかを識別するものである.一方,動作予測とはユーザ(ジェスチャ行為者)の数フレーム後の状態を推定するものである.本報告では比較的単純なアプローチにより以上2つの課題を検討しながら,それらの原理的な限界を明らかにする.さらに,そうした限界を踏まえた上で,プロアクティブヒューマンインタフェースの開発等,今後さらに検討を進めて行くための適切な方針について展望する..
256. 原 学, 内田 誠一, 迫江 博昭, 画素を単位とした視差補償に基づくステレオ画像圧縮の検討, 情報処理学会研究報告. AVM,[オーディオビジュアル複合情報処理], Vol.46, No.99, pp.1-6, 2004.10, 本稿では画素を単位とした視差補償を用いたステレオ画像圧縮手法を検討する.画素を単位とすることで,従来のブロックベースでの視差補償を用いた庄縮手法よりも残差の符号量を低減できる.一方,視差の符号量が増加するが,この問題に対して視差に制約条件を加えることで符号量を抑えることを提案する.以上の手法について,視差および残差の符号量を更に低減するための2つの改良を加える.第1は,オクルージョン領域において同一画像上の隣接画素との残差を取得する方法(前値予測)に切り替えるという改良である.第2は,カメラの進行方向に対して垂直方向に長いブロックを単位として視差補償を行うという改良である.実際にステレオ画像を用いて実験を行ったところ,本手法の有効性を確認できた..
257. 倉爪 亮, 内田 誠一, 谷口 倫一郎, 長谷川 勉, プロアクティブヒューマンインターフェースの研究 -第3報 予測駆動型アクティブインターフェース実験-, 日本ロボット学会学術講演会, 2004.09.
258. 宮崎 洋光, 内田 誠一, 迫江 博昭, 粗密DPによる画像の弾性マッチングの高速化, 九州大学大学院システム情報科学紀要, 10.15017/1516051, Vol.9, No.2, pp.79-84, 2004.09, In image pattern recognition, elastic matching based on dynamic programming (DP) has been used as an effective technique to obtain a deformation-invariant distance between image patterns. A practical problem of elastic matching is its huge computation time. In this report, a fast elastic matching technique based on coarse-to-fine DP (CFDP) is proposed. In CFDP, a heuristic search strategy is employed to reduce computation time while keeping the global optimality of matching. The effect of the proposed technique on reducing computation time was indicated by experimental results..
259. 内田 誠一, 倉爪 亮, 谷口 倫一郎, 長谷川 勉, 迫江 博昭, I-075 プロアクティブヒューマンインタフェースのためのジェスチャの早期認識に関する検討(I.画像認識・メディア理解), 情報科学技術フォーラム一般講演論文集, Vol.3, No.3, pp.179-181, 2004.08.
260. 松本 直樹, 内田 誠一, 迫江 博昭, 弾性マッチングに基づく画像パターン認識のための標準パターン設定法に関する検討, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理, Vol.87, No.7, pp.1539-1542, 2004.07, 弾性マッチングに基づく画像パターン認識のための標準パターン設定法について述べる.本手法はクラスタリング法の一種であるが,従来法がユークリッド距離を基準としているのに対し,本手法では識別時と同じ弾性マッチングによる距離を基準とする..
261. 内田 誠一, 迫江 博昭, カテゴリー固有変形の線形結合モデルに基づく弾性マッチング法(画像処理,画像パターン認識), 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理, Vol.87, No.2, pp.639-648, 2004.02, 画像パターンの認識において,パターンに生じた変形を補償するための手法として,弾性マッチングの利用が検討されている.従来法がすべてのカテゴリーに共通の変形特性を仮定していたのに対し,本論文では各カテゴリーに固有の変形特性を組み込んだ手法を提案する.具体的には,各カテゴリーの任意の変形をそのカテゴリーに固有ないくつかの変形の線形結合で表現する.その結果,各カテゴリー内に生じる変形だけが適切に補償されることになり,過変形の抑制及び計算効率の向上といった効果が得られる.本手法は,一種の非線形最適化問題として定式化される.本論文ではその解法についても述べ,実験を通して有効性を検証する..
262. 平 英二, 高山 誠悟, 内田 誠一, 迫江 博昭, モデル当てはめによる書棚画像解析(画像処理,画像パターン認識), 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理, Vol.87, No.2, pp.565-573, 2004.02, 本論文では画像処理による書籍管理を目的として書棚画像から各書籍の境界を検出する手法を提案する.従来法ではエッジや影からハフ変換などの直線検出法を用いて書籍境界を検出している.本手法では,そのような局所的な情報だけでなく大域的な最適性も考慮して,書棚画像の最適領域分割(各書籍の背表紙領域,書棚背景領域)を動的計画法に基づくアルゴリズムにより行い,各書籍の境界を検出する.更に最適化問題として定式化する際,書棚画像の文法モデルを組み込むことで高精度化を図っている.実験により,本手法の有効性を定性的及び定量的に確認した..
263. 三苫 寛人, 内田 誠一, 迫江 博昭, 固有変形を用いたオンライン文字認識の検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.103, No.659, pp.13-18, 2004.02, DPマッチングなど,いわゆる弾性マッチングに基づくオンライン文字認識においては,合わせ過ぎによる誤認識が発生する.例えば入力パターンが「1」であっても,マッチングによって水平部が非線形伸縮された結果,「7」に誤認識される場合がある.本報告では,こうした誤認識の低減手法を提案する.合わせ過ぎの発生原因には,弾性マッチングが本来そのカテゴリでは起こりえないような変形も吸収の対象としていることが挙げられる.そこで本手法では,あらかじめ各カテゴリに生じ易い変形(固有変形)を統計的手法により求めておき,認識の際のマッチングの結果が,その固有変形からどれぐらい逸脱しているかを評価する.その逸脱量が大きければ,そのマッチングにより合わせ過ぎが起きていると判断できる.オンライン数字データを用いた認識実験により,本手法の有効性を確認した..
264. 三苫 寛人, 内田 誠一, 迫江 博昭, 固有変形を用いたオンライン文字認識の検討, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.103, No.657, pp.13-18, 2004.02, DPマッチングなど,いわゆる弾性マッチングに基づくオンライン文字認識においては,合わせ過ぎによる誤認識が発生する.例えば入力パターンが「1」であっても,マッチングによって水平部が非線形伸縮された結果,「7」に誤認識される場合がある.本報告では,こうした誤認識の低減手法を提案する.合わせ過ぎの発生原因には,弾性マッチングが本来そのカテゴリでは起こりえないような変形も吸収の対象としていることが挙げられる.そこで本手法では,あらかじめ各カテゴリに生じ易い変形(固有変形)を統計的手法により求めておき,認識の際のマッチングの結果が,その固有変形からどれぐらい逸脱しているかを評価する.その逸脱量が大きければ,そのマッチングにより合わせ過ぎが起きていると判断できる。オンライン数字データを用いた認識実験により,本手法の有効性を確認した..
265. 内田 誠一, 野村 明弘, 鈴木 昌和, 数学文書データベースの解析, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.103, No.659, pp.19-24, 2004.02, 数式を含んだ文書のための実用的なOCRの実現のために,数学文書を幾つかの観点から解析する.具体的には,67万文字からなる正解付き数学文書データベースを準備し,(i)文字カテゴリ数,(ii)接触文字や分離文字などの異常文字数,(iii)文字サイズの変動量,(iv)数式の複雑さ,の4点を中心として定量的に解析する.解析を通して,数学文書を認識する際の困難性が数値として明らかにする.また,そうした問題点に対する解決策についても触れる..
266. 内田 誠一, 野村 明弘, 鈴木 昌和, 数学文書データベースの解析, 電子情報通信学会技術研究報告. TL, 思考と言語, Vol.103, No.657, pp.19-24, 2004.02, 数式を含んだ文書のための実用的なOCRの実現のために,数学文書を幾つかの観点から解析する.具体的には,67万文字からなる正解付き数学文書データベースを準備し,(i)文字カテゴリ数,(ii)接触文字や分離文字などの異常文字数,(iii)文字サイズの変動量,(iv)数式の複雑さ,の4点を中心として定量的に解析する.解析を通して,数学文書を認識する際の困難性が数値として明らかにする.また,そうした問題点に対する解決策についても触れる..
267. 松本 直樹, 内田 誠一, 迫江 博昭, 弾性マッチングを用いた画像パターン認識のためのクラスタリング法に関する基礎的検討, 九州大学大学院システム情報科学紀要, 10.15017/1515850, Vol.8, No.2, pp.159-164, 2003.09, A technique for setting standard patterns for image pattern recognition based on elastic matching is investigated. The proposed technique is a kind of clustering techniques, which generally provide standard patterns as the centroids of the distribution of training patterns in pattern space. In conventional clustering techniques, the centroid is defined as the local center of gravity under the metric of the Euclidean distance. Contrary to this, in the proposed technique an elastic matching distance is newly employed as the metric. Thus, the same elastic matching-based metric is consistently used at the standard pattern setting stage and the recognition stage with the proposed technique, whereas different metrics are inconsistently used in those stages with the conventional technique. From experimental results, it was shown that high recognition rates can be attained with the standard patterns provided by the proposed technique because of the consistency of the metric..
268. 松本 直樹, 内田 誠一, 迫江 博昭, 弾性マッチングを用いた画像パターン認識のための標準パターン設定法, 電子情報通信学会技術研究報告. IE, 画像工学, Vol.103, No.206, pp.41-46, 2003.07, 弾性マッチングを用いた画像パターン認識のための標準パターン設定法を提案する.本手法はクラスタリング法の一種であり,パターン空間における学習パターンの分布の局所的な重心を標準パターンとして用いる.従来手法では重心を求める際の距離尺度にはユークリッド距離を用いているのに対し,本手法では新たに距離尺度として認識時と同じ弾性マッチング距離を用いる.従来手法では標準パターン設定時と認識時の間で距離尺度が一致しないのに対し,本手法では距離尺度が一致することになる.実験により,本手法により設定された標準パターンを用いたほうが高い認識率が得られることが確認された..
269. 松本 直樹, 内田 誠一, 迫江 博昭, 弾性マッチングを用いた画像パターン認識のための標準パターン設定法, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, Vol.103, No.210, pp.41-46, 2003.07, 弾性マッチングを用いた画像パターン認識のための標準パターン設定法を提案する.本手法はクラスタリング法の一種であり,パターン空間における学習パターンの分布の局所的な重心を標準パターンとして用いる.従来手法では重心を求める際の距離尺度にはユークリッド距離を用いているのに対し,本手法では新たに距離尺度として認識時と同じ弾性マッチング距離を用いる.従来手法では標準パターン設定時と認識時の間で距離尺度が一致しないのに対し,本手法では距離尺度が一致することになる.実験により,本手法により設定された標準パターンを用いたほうが高い認識率が得られることが確認された..
270. 松本 直樹, 内田 誠一, 迫江 博昭, 弾性マッチングを用いた画像パターン認識のための標準パターン設定法, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.103, No.208, pp.41-46, 2003.07, 弾性マッチングを用いた画像パターン認識のための標準パターン設定法を提案する.本手法はクラスタリング法の一種であり,パターン空間における学習パターンの分布の局所的な重心を標準パターンとして用いる.従来手法では重心を求める際の距離尺度にはユークリッド距離を用いているのに対し,本手法では新たに距離尺度として認識時と同じ弾性マッチング距離を用いる.従来手法では標準パターン設定時と認識時の間で距離尺度が一致しないのに対し,本手法では距離尺度が一致することになる.実験により,本手法により設定された標準パターンを用いたほうが高い認識率が得られることが確認された..
271. 内田 誠一, 迫江 博昭, D-12-30 固有変形を組み込んだ弾性マッチングによる手書き文字認識, 電子情報通信学会総合大会講演論文集, Vol.2003, No.2, p.191, 2003.03.
272. 内田 誠一, 迫江 博昭, カテゴリ毎の変形特性を組み込んだ弾性マッチングによる手書き文字認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.102, No.707, pp.49-54, 2003.03, For handwritten character recognition, a new elastic image matching (EM) technique based on a category-dependent deformation model is proposed. In the deformation model, any deformation of a category is described by a linear combination of eigen-deformations, which are intrinsic deformation directions of the category. The eigen-deformations can be estimated statistically from the actual deformations of handwritten characters. Experimental results show that the EM present technique can attain higher recognition rates than conventional EM techniques based on category-independent deformation models. The results also show the superiority of the present technique over those conventional EM techniques in computational efficiency..
273. 野村 明弘, 道下 一行, 内田 誠一, 鈴木 昌和, 数式中の接触文字の画像マッチングに基づく切り分け法, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.102, No.708, pp.31-35, 2003.03, あらまし 数式中の接触文字の検出法と分離法について提案する.検出法では,本来ある文字に認識された連結成分の特微量を計算し,事前に準備した各文字種ごとの標準の特微量と比較をし,ー致しなければその文字は接触文字候補とする.分離法では,2つの非接触文字画像を合成した画像と検出法によって検出された接触文字候補と比較して,接触文字候補の2つの構成文字を決定する,実験では,数式の認識の精度改善において有効性を示した..
274. 平 英二, 高山 誠悟, 内田 誠一, 迫江 博昭, 動的計画法による書棚画像からの書籍境界検出, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.102, No.532, pp.85-89, 2002.12, 画像処理による書籍管理を目的として書棚画像から各書籍の境界を検出する手法を提案する.従来法ではエッジや影により書籍境界を検出している.本手法では,そのような局所的な情報だけでなく全体的な最適性も考慮して,書棚画像の最適領域分割(各書籍の背表紙領域,書棚背景領域等)を文法制御を組み込んだ動的計画法に基づくアルゴリズムにより行う.実験により本手法の有効性を確認する..
275. 内田 誠一, 迫江 博昭, 画素を単位とした動き補償に関する検討 : 水平方向に限定した予備検討(高精細画像の処理・表示および一般), 映像情報メディア学会技術報告, Vol.26, No.76, pp.25-30, 2002.11, 動画像圧縮においては,圧縮率向上のために動き補償が利用される.ブロックやパッチといった小領域を単位とする従来の動き補償法では,動き情報に要する符号量が少くて済む反面,小領域内の細かい動きには追従できず残差の極小化能力には限界があった.そこで本研究では,画素を単位とした動き補償について検討する.動き情報符号量の増加を如何に抑えるかが課題となるが,隣接画素間の動きを相互に制約することで解決を図る.本報告では,第一段階として,水平方向に限定した場合について考察を行う.実験により,動きの大きな動画像の圧縮における有効性を示した..
276. 内田 誠一, 迫江 博昭, 画素を単位とした動き補償に関する検討 : 水平方向に限定した予備検討, 電子情報通信学会技術研究報告. IE, 画像工学, Vol.102, No.468, pp.25-30, 2002.11, 動画像圧縮においては,圧縮率向上のために動き補償が利用される.ブロックやパッチといった小領域を単位とする従来の動き補償法では,動き情報に要する符号量が少くて済む反面,小領域内の細かい動きには追従できず残差の極小化能力には限界があった.そこで本研究では,画素を単位とした動き補償について検討する.動き情報符号量の増加を如何に抑えるかが課題となるが,隣接画素間の動きを相互に制約することで解決を図る.本報告では,第一段階として,水平方向に限定した場合について考察を行う.実験により,動きの大きな動画像の圧縮における有効性を示した..
277. 内田 誠一, 松本 直樹, 迫江 博昭, 2次元ワープを用いた顔画像処理, 電気学会研究会資料. IP, 情報処理研究会, Vol.2002, No.1, pp.25-30, 2002.08.
278. 内田 誠一, 迫江 博昭, D-12-71 弾性マッチングに基づく手書き文字認識における固有変形の利用, 電子情報通信学会総合大会講演論文集, Vol.2002, No.2, 2002.03.
279. 古性 淑子, 平野 光一, 内田 誠一, 迫江 博昭, D-15-3 筆順指導機能つき漢字筆記学習システムの試作, 電子情報通信学会総合大会講演論文集, Vol.2002, No.1, p.192, 2002.03.
280. 高山 誠悟, 平 英二, 内田 誠一, 動的計画法を用いた書棚画像中の書籍の傾き補正法, 九州大学大学院システム情報科学紀要, 10.15017/1525442, Vol.7, No.1, pp.37-40, 2002.03, For building book database or managing book arrangement automatically, systems to extract book information, such as title, from bookshelf images have been studied. In such systems, slant of each book in bookshelf images may degrade the extraction accuracy. In this paper, a slant correction technique for bookshelf images is proposed where the slant correction problem is formulated as an optimal estimation problem of local slant angles at all horizontal positions. The optimal estimation is provided by a dynamic programming-based algorithm. In the present technique, color features are utilized for improving the slant estimation accuracy. The effectiveness of the present technique was shown by experiments..
281. 内田 誠一, 迫江 博昭, 事前知識フリーな区分線形2次元ワープ, 映像情報メディア学会誌 : 映像情報メディア, 10.3169/itej.55.1643, Vol.55, No.12, pp.1643-1649, 2001.12, Piecewise linear two-dimensional warping (PL2DW) is a practical elastic image matching technique where the pixel-to-pixel correspondence function between a pair of image patterns is defined as a piecewise linear 2D-2D mapping. For accurate matching, the boundary points of linearization, called "pivots", should be placed at the bending and stretching points of image patterns. In conventional PL2DW, it is assumed that the pivots are properly placed by users before their mapping is optimized. This assumption, however, is acceptable only when the a priori knowledge about the deformation charact....
282. 内田 誠一, ロニー モハマッド アサッド, 迫江 博昭, 手書き文字の固有変形の抽出と認識処理での利用, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.101, No.525, pp.117-124, 2001.12, 手書き文字の変形は無秩序ではなく, 一定の傾向に従って生じると考えられる.すなわち, 各文字種においては, その変形に固有の方向性があると考えられる.例えば文字「A」については, その全体的な傾き変化は見られるが, 「R」に似てしまうような変形は実際には生じない.本論文では, こうした文字種固有の変形特性の抽出について述べる.具体的には, 弾性マッチング法により自動的に多数の変形を採集し, それらに主成分分析を施すことで変形の主軸方向すなわち固有変形を抽出する.実験の結果, この方法で手書き文字に普段見られる変形が抽出できることがわかった.さらに固有変形を弾性マッチングに基づく文字認識システムにおいて利用した結果, 過変形による誤認識が低減され, 認識率を向上できることがわかった..
283. ロニー モハマッド アサッド, 内田 誠一, 迫江 博昭, 区分線形2次元ワープによる手書き文字認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.100, No.701, pp.31-38, 2001.03, 本報告では,手書き文字認識における,区分線形2次元ワープの文字歪みの吸収に対する有効性を検討する.区分線形2次元ワープは,画像の弾性マッチングを目的とした,区分的に線形化された2次元-2次元写像の一種であり,回転や部分的な位置移動といった手書き文字画像における形状歪みの大部分を吸収できる程度の自由度を有している.ワープは区分線形化の境界点を基準として制御され,動的計画法(DP)に基づくアルゴリズムにより最適化される.アルゴリズムの計算量は区分線形化の効果により,現実的なレベルに押えられている.ETL6の英大文字26文字種を対象とした認識実験により,従来のDPに基づくいくつかの2次元ワープ法に対する本手法の優位性を確認した.また,自由度のより高い他の2次元ワープ法との比較を行なった結果,本手法はほとんどのカテゴリーにおいてほぼ同等の認識率を示しており,このことから区分線形化の影響が少ないことを確認した..
284. 山田 圭, 内田 誠一, 迫江 博昭, 区分線形周波数ワープによる話者正規化の検討, 九州大学大学院システム情報科学紀要, 10.15017/1515722, Vol.6, No.1, pp.89-92, 2001.03, An efficient algorithm for speaker-independent spoken word recognition is presented. This algorithm is based on the time-frequency warping with inter-frame consistency, where each frame of an input pattern is mapped to a reference pattern by controlling the mapping of several points (pivots) on the frame. The mapping of non-pivot points is given by linear interpolation between mapping of two consecutive pivots. The optimal mapping is obtained by using a dynamic programming based algorithm. The computational complexity of the algorithm is reduced to less than that of the previous time-frequency warping algorithm with inter-frame consistency. Experimental results show advantageous characteristics of the present algorithm..
285. 平 英二, 石田 敏之, 内田 誠一, 迫江 博昭, 手書き文字列の非一様な傾き補正法, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.100, No.701, pp.47-52, 2001.03, 文字列の認識において,各構成文字の傾き補正は認識精度向上を図る上で必須技術である.従来法では,文字列内の各構成文字が一定の角度で傾いているという仮定の下,一様な傾き補正を行なっていた.これに対し,本論文では非一様な傾きも補正可能な手法を提案する.本手法では傾き補正問題を局所傾き角の最適推定問題として定式化する.その最適推定を動的計画法に基づくアルゴリズムにより行なう.一様な傾き補正法との比較実験を行ない,本手法の傾き補正能力が優れていることを定性的および定量的に示す..
286. 平 英二, 石田 敏之, 内田 誠一, 手書き文字列認識を目的としたワープによる文字傾きの補正法, 九州大学大学院システム情報科学紀要, 10.15017/1515723, Vol.6, No.1, pp.93-98, 2001.03, Slant correction of characters is necessary in the segmentation of a handwritten word into component characters. Conventional slant correction techniques estimate the average slant angle of component characters and correct only uniform slant resulting residual error for each character. In this paper, a slant correction technique which can well correct nonuniform slant is proposed. In the present technique, the slant correction problem is formulated as a non-linear mapping problem of slanted strokes onto vertical straight lines. Then a dynamic programming-based two-dimensional warping algorithm is applied to optimize the mapping. The effectiveness of the present technique was shown by experiments..
287. 内田 誠一, 迫江 博昭, 区分線形2次元ワープ法の検討, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理, Vol.83, No.12, pp.2622-2629, 2000.12, 2画像の最大一致を与える2次元-2次元写像を2次元ワープと呼ぶ.パターン認識の立場から見れば, 2次元ワープは画像の弾性マッチング処理であり, 同時に画素をプリミティブとする構造解析処理でもある.筆者らは単調連続性の条件下で純粋に非線形な2次元ワープを探索する動的計画アルゴリズムを検討してきたが, 計算量が画像サイズの指数オーダとなる問題があった.その改善を目指し, 本論文では区分線形2次元ワープ法を提案する, 本手法では画像の各行のワープによる像は折れ線となる.ワープの最適化はこの折れ線の屈曲点の位置に関して行われる.最適ワープを求めるための計算量は単調連続2次元ワープの場合に比べて大幅に低減される.計算機実験を通じて, 本手法の有効性及び問題点を考察する..
288. 内田 誠一, 迫江 博昭, 単調連続2次元ワープ法によるオフライン手書き文字認識実験, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理, Vol.83, No.4, pp.1198-1200, 2000.04.
289. 内田 誠一, 迫江 博昭, 単調連続2次元ワープによる手書き文字認識に関する実験的検討, 九州大学大学院システム情報科学研究科報告, 10.15017/1513736, Vol.5, No.1, pp.93-98, 2000.03, A handwritten character recognition experiment using a monotonic and continuous two-dimensional warping algorithm is reported. This warping algorithm is based on dynamic programming and searches for the optimal pixel-to-pixel mapping between given two images subject to two-dimensional monotonicity and continuity constraints. Experimental comparisons with rigid matching and local perturbation show the performance superiority of the monotonic and continuous warping in character recognition..
290. 内田 誠一, 迫江 博昭, 対象の事前知識が利用不可能な場合に対応した区分線形2次元ワープ, 電子情報通信学会総合大会講演論文集, Vol.2000, No.2, p.187, 2000.03.
291. 石田 敏之, 内田 誠一, 迫江 博昭, 手書き文字認識における字形変動処理に関する一検討 : ダッチロールワープ, 電子情報通信学会総合大会講演論文集, Vol.2000, No.2, p.183, 2000.03.
292. 石田 敏之, 内田 誠一, 迫江 博昭, 手書き文字認識における字形変動処理に関する一検討--ダッチロールワープ, 九州大学大学院システム情報科学研究科報告, 10.15017/1513737, Vol.5, No.1, pp.99-104, 2000.03, An efficient elastic image matching technique is investigated with application to off-line handwritten character recognition. In the present technique, each column of an image is mapped to another by controlling the mappings of the two endpoints of the column and linearly interpolating between them. Thus, the technique can adjust nonlinear deformation of images, with local slant and translation. The dynamic programming (DP) based algorithm searches for the optimal mapping with a reasonable amount of computation. The effectiveness of the present technique was indicated by recognition experiments on handwritten English alphabets..
293. 内田 誠一, ロニー モハマッド アサッド, 石田 敏之, 迫江 博昭, 区分線形2次元ワープによる手書き文字の変形吸収の試み, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.99, No.648, pp.67-74, 2000.02, 本報告では, 区分線形2次元ワープによる手書き文字歪みの吸収を検討する.区分線形2次元ワープは, 画像の弾性マッチングを目的とした, 区分的に線形化された2次元-2次元写像の一種である.画像の各行は, その上に設定された節点で線形伸縮を伴いながら2次元に屈曲され, もう一方の画像上に折れ線として重ね合わせられる.この仕組みにより文字形状の2次元的な手書き歪みを吸収する.文字画像では多くの場合, 節点数は少なくて済むと考えられるので, ワープは現実的な計算量で実行できる.ETL6の英大文字26文字種を対象とした認識実験を行い, 1次元弾性マッチングの組合せに基づく従来法よりも高い, 97.5%の認識率を得た.また, 誤認識の原因についても考察した..
294. S Uchida, H Sakoe, An approximation algorithm for two-dimensional warping, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, Vol.E83D, No.1, pp.109-111, 2000.01, A new efficient two-dimensional warping algorithm is presented, in which sub-optimal warping is attained by iterating DP-based local optimization of warp on partially overlapping subplane sequence. From an experimental comparison with a conventional approximation algorithm based on beam search DP, relative superiority of the proposed algorithm is established..
295. 山田 圭, 内田 誠一, 迫江 博昭, D-12-13 区分線形周波数ワープによる話者正規化の検討, 電子情報通信学会ソサイエティ大会講演論文集, Vol.1999, No.0, p.177, 1999.08.
296. 内田 誠一, 迫江 博昭, D-12-20 区分線形2次元ワープ法の提案, 電子情報通信学会ソサイエティ大会講演論文集, Vol.1999, No.0, p.184, 1999.08.
297. 内田 誠一, 迫江 博昭, 区分線形型2次元ワープ法の検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.99, No.47, pp.69-76, 1999.05, 2次元-2次元弾性マッチングを実現する2画像間の写像を2次元ワープと呼ぶ. 筆者らはこれまでに単調連続性の条件下で純粋に非線形な2次元ワープを探索する動的計画アルゴリズムを検討してきたが, 計算量が画像サイズの指数オーダーとなる問題があった. この改善を目指し, 本報告では区分線形型2次元ワープ法を提案する. 本手法では各行のワープの結果は折れ線となる. ワープの最適化はこの折れ線の屈曲点に対して行われる. 最適ワープを求めるための計算量は単調連続2次元ワープの場合に比べ大幅に低減される. 屈曲点の数が1や2の場合について区分線形型2次元ワープの結果を示し, 本手法の有効性および問題点を検討する. また幾つかの拡張・特殊化モデルについても考察する..
298. 内田 誠一, 迫江 博昭, D-12-98 単調連続2次元ワープの高速な近似アルゴリズム, 電子情報通信学会総合大会講演論文集, Vol.1999, No.2, 1999.03.
299. 内田 誠一, 迫江 博昭, 単調連続2次元ワープ法によるオフライン手書きひらがな認識, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.98, No.490, pp.103-110, 1998.12, 単純重ね合わせ法によるオフライン文字認識は, 原理のわかりやすさと処理の単純さという利点を持つ反面, 画像中の文字パターンの変形に弱いという欠点を持つ.そのため, 2画像の最大一致を与えるマッピングにより一方の画像を変形させ, その後で重ね合わせを行なう手法が検討されている.本報告では, 文字画像の変形法として単調連続2次元ワープ法を用いた結果について報告する.単調連続2次元ワープ法とは, 単調連続性条件の下で2画像の最大一致を実現する画素間のマッピングを, 動的計画法(DP)に基づくアルゴリズムにより求める方法である.ETL8Bのひらがな46文字種を対象として認識実験を行った結果, 単純重ね合わせ法(93.9%)や各画素独立な摂動法(94.3%)よりも高い認識率(97.0%)が得られ, 単調連続2次元ワープ法の手書き文字認識に対する有効性が確認された..
300. 山田圭, 内田 誠一, 迫江 博昭, フレーム間で連続な時間・周波数ワープによる話者正規化の検討, 九州大学大学院システム情報科学紀要, 10.15017/1498357, Vol.3, No.2, pp.197-202, 1998.06, A new algorithm for speaker-independent spoken word recognition is presented. The algorithm is based on the time-frequency warping technique where frequency axis warping is performed in order to adjust individual spectral difference, in addition to time axis warping. In the conventional algorithm, frequency axis warping is independently determined at each frame (i.e., time). In this case, such warp have a tendency to yield excessive deformations of time-frequency plane, it is feared. In order to suppress such excessive deformations, inter-frame consistency of frequency axis warping is newly taken into account as constraints on the warping. The optimal warping is obtained by using dynamic programming with the constraints. As an implementation technique, beam search based acceleration is also investigated. Experimental results indicates advantageous characteristics of the present algorithm over the conventional algorithm..
301. 内田 誠一, 迫江 博昭, 動的計画法に基づく単調連続2次元ワープ法の検討, 電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理, Vol.81, No.6, pp.1251-1258, 1998.06, 2画像間の最大一致を実現する画素間のマッピングとして定義される2次元ワープは, パターンに生じる変形に適応可能なテンプレートマッチング法とみなすことができる.本論文では新しい2次元ワープ法の枠組みを提案し, 基礎的な考察を行う.本手法の第一の特徴は, 2次元的な自由度をもちながら, パターンの位相を保存するワープを構成できることである.この性質はワープに対する単調性および連続性制約により実現される.第2の特徴は, 画像全体での最適性が保証されるように構成された動的計画法(DP)を, 最大一致の探索法として用いる点である.DPの利用により, 評価関数に対する微分可能性の制約がないなどの特長も生じる.実験により, 提案した手法の基本的特性を確認した..
302. 内田 誠一, 迫江 博昭, 単調連続2次元ワープ問題の高能率解法, 電子情報通信学会総合大会講演論文集, Vol.1998, No.2, p.251, 1998.03.
303. 内田 誠一, 迫江 博昭, 単調連続2次元ワープ問題のマルコフモデル表現と動的計画法による解法, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.97, No.458, pp.1-8, 1997.12, 筆者らが検討している単調連続2次元ワープは, 2画像間の最適一致を実現する画素単位のマッピングの一種であり, 1)パターンの位相を近似的に保存するワープを構成できる, 2)画像全体での2次元的な最適性が保証される動的計画法(DP)を最適一致の探索法として用いる, という特徴を持つ. 単調連続2次元ワープは多くの画像マッチング問題への有効性が期待されるが, 最適解を求めるための計算量が非常に多いという問題があった. 本報告では, より少ない計算量で最適解を求めるための, 単調連続2次元ワープ問題の新たなモデルを提案する. このモデルはleft-to-rightな有限状態オートマトン(FSA)にコストが付随した, いわゆる単純マルコフ決定過程であり, その最適経路問題として単調連続2次元ワープ問題が表現される. このようなモデルは従来解法でも用いられていたが, 本報告で与えるモデルの方が可能な状態遷移の数が大幅に少ないので, より少ない計算量で最適解が求まるアルゴリズムが構成できる. またこのモデル上での準最適解アルゴリズムについても考察し, 従来の準最適解アルゴリズムよりも最適化能力の点で有利であることを示す..
304. 山田 圭, 内田 誠一, 迫江 博昭, フレーム間単調連続周波数ワープによる不特定話者単語音声認識の検討, 電子情報通信学会技術研究報告. IE, 画像工学, Vol.97, No.203, pp.73-78, 1997.07, 不特定話者単語音声認識に用いられる周波数ワープの改良を試みた。従来法での周波数方向のワープが隣接するフレーム間で独立に行なわれており、極端な不連続現象を許容しかねないことを問題点と考え、隣接フレームのワープ間に連続性の拘束を導入した。アルゴリズムは、周波数、隣接フレーム間、時間方向のそれぞれにおいて単調性と連続性を保存する一種の2次元ワープとなっている。実験において、提案した手法の有効性を確かめるとともに、近似的な高速アルゴリズムに関しても検討した。.
305. 山田 圭, 内田 誠一, 迫江 博昭, フレーム間単調連続周波数ワープによる不特定話者単語音声認識の検討, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, Vol.97, No.207, pp.73-78, 1997.07, 不特定話者単語音声認識に用いられる周波数ワープの改良を試みた。従来法での周波数方向のワープが隣接するフレーム間で独立に行なわれており、極端な不連続現象を許容しかねないことを問題点と考え、隣接フレームのワープ間に連続性の拘束を導入した。アルゴリズムは、周波数、隣接フレーム間、時間方向のそれぞれにおいて単調性と連続性を保存する一種の2次元ワープとなっている。実験において、提案した手法の有効性を確かめるとともに、近似的な高速アルゴリズムに関しても検討した。.
306. 山田 圭, 内田 誠一, 迫江 博昭, フレーム間単調連続周波数ワープによる不特定話者単語音声認識の検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.97, No.205, pp.73-78, 1997.07, 不特定話者単語音声認識に用いられる周波数ワープの改良を試みた。従来法での周波数方向のワープが隣接するフレーム間で独立に行なわれており、極端な不連続現象を許容しかねないことを問題点と考え、隣接フレームのワープ間に連続性の拘束を導入した。アルゴリズムは、周波数、隣接フレーム間、時間方向のそれぞれにおいて単調性と連続性を保存する一種の2次元ワープとなっている。実験において、提案した手法の有効性を確かめるとともに、近似的な高速アルゴリズムに関しても検討した。.
307. 内田 誠一, 迫江 博昭, 単調連続2次元ワープの効率化と拡張, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.97, No.40, pp.135-142, 1997.05, 筆者らは以前に,画像のnon-rigidなテンプレートマッチング法である単調連続2次元ワープを提案した.単調連続2次元ワープはパターンの位相を近似的に保存した変形が可能であり,文字認識や対応点検出問題への有効性が期待される.更に動的計画法に基づく手法であるため,求まるワープの最適性が保証されるという特長も持っている.しかし,計算量が画像サイズに対して指数オーダーで増加し,現実的なサイズの画像を取り扱うのは困難であった.本報告では枝刈法により多項式時間で準最適解を求める方法について述べる.また,この効率化による最適解からのずれとワープの自由度に起因した,パターンの極端な変形を避けるために,ペナルティの導入を検討する.これら2点の改善により,現実的なサイズの画像間に精度良くワープが構成可能となることを実験により示す..
308. 内田 誠一, 迫江 博昭, 単調連続2次元ワープ法の検討, 電子情報通信学会総合大会講演論文集, Vol.1997, No.2, pp.443-444, 1997.03, 2次元ワープは, 入力向像の各ピクセルからモデル画像のピクセルへの最適なマッピングと定義され, そのマッピングに対する制約条件と, マッピングアルゴリズムによって, 幾つかのタイプに分類される. 本稿では, Levinらで考慮されていた単調性に加え, 新たに連続性を制約条件として導入した, ノンパラメトリックな2次元ワープを提案する. この連続性によりピクセルの近傍関係を保存するワープが実現し, 2画像間の対応点検出, 文字認識, 画像データベース検索, frequency warping等への応用が期待できる. 単調連続2次元ワープを求める問題には動的計画法 (DP) が適用でき, 最適解を求めることができる. また枝刈法の導入により, 計算量を大幅に低減できることを示す..
309. 迫江 博昭, 内田 誠一, 単調連続2次元ワープ法の検討, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, Vol.96, No.384, pp.7-14, 1996.11, 2次元ワープは, 入力画像からモデル画像への最適なピクセルマッピングと定義される. 種々の2次元ワープはその制約条件で特徴付けられる. 今回提案する, 単調性および連続性を満たすノンパラメトリックな2次元ワープは, 入力画像に対して位相を保存する非線形変換を施すことに相当し, 多くのパターンマッチング問題に有用であると考えられる. 本報告では, 制約条件による2次元ワープの分類, および動的計画法による単調連続2次元ワープの効率的な構成法について述べる. さらに, 計算量に関する考察を行ない, また近傍を考慮したピクセル間距離の導入を検討する..
310. 迫江博昭, 片山 喜規, 内田 誠一, 文音声認識を目的としたCYK解析アルゴリズムの効率化, 九州大学大学院システム情報科学紀要, 10.15017/1474974, Vol.1, No.1, pp.95-100, 1996.09, An efficient implementation of CYK-based continuous speech recognition is investigated. First, the word level and the sentence level processes in Ney's algorithm were reorganized so that they proceed in synchronization with input frame. Then, beam search prunings were incorporated into the two processing levels. A new acceleration technique, beam data driven parsing, was successfully introduced. Considerable improvements in computational and memory efficiency were established through a sentence speech recognition experiment..

九大関連コンテンツ

pure2017年10月2日から、「九州大学研究者情報」を補完するデータベースとして、Elsevier社の「Pure」による研究業績の公開を開始しました。