■
岡崎彰夫氏
スライドなのに資料がないためものすごい勢いでノートを取るテスト
論理回路パターン
不良箇所のなかには、人間の目でみる以外に対処する方法がないものがある。
⇒なんとか機械化できないか
スキャナを利用してパターンの画像認識(みたいな)
地図の例
図面・地図(紙媒体)をコンピュータにどのように認識するか
- 地図の自動読み取り(ラスタ-ベクタ変換)
- 四角っぽいものを認識して読み取る。
- 製品化されたものMINDSシリーズ
- 情報管理装置(ワークステーション)
- パンチカードだったらしい
- 光ディスクモジュールとかで地図を格納している。
- 新宿全体の地図を読み込ませて90%くらいの精度で読み込むことができた。
- 高さによって地図を色分けしたり、色々便利
- カーナビとかへの応用
- 地図情報と航空写真との重ね合わせ表示
- 都市の3次元表示の例(ほかの使用例を考えた)
- バーチャルリアリティとかが流行っていたのでやってみた
車載画像認識技術
走行車両に車載されたカメラからの動画像をリアルタイムに解析し、他の走行車両の動きを検出する技術(運転支援システムに応用)
- 後方監視の応用例
- 相関演算によりオプティカルフロー(動きベクトル)を算出
- 自分が動いているので、周囲の止まっている物体の動きベクトルの終端は1点に収束する。
- 追い越し車両の動きベクトルは逆向きになる(自分より速いから)
- フローの向きによって追い越し車両を区別し検出
- 相関演算によりオプティカルフロー(動きベクトル)を算出
レーザーレーダやミリ波レーダを用いた処理も行うが、実際に道路上に記述されたものなどカメラでしか認識できないものも存在する。将来的には両方の技術を組み合わせて実用化することになるだろう
セキュリティ回り
顔照合セキュリティシステム
コンピュータビジョン*1の難しさ
- 処理データ量が多い
- VGA*8ビットRGBx30fps=約28MB/s
- 車載のため大型化できず、電力消費も抑えなければならない。(もちろん安価に)
- 本質的な難しさではなく開発的な難しさ
- 3次元世界から2次元世界へ情報が縮退している
- 人間は自動的に補完しているが…
- 対象物や対称世界の表現(モデル化)方法や知識、常識の利用方法がよくわからない。
例:本を読む
コンピュータはレイアウトの知識を利用して文章の位置を認識し、文字切り出しのための知識を利用して文字の位置を見つけ、文字の形状の知識を利用して文字の候補を挙げ、単語・文章の知識を利用して読み込んだ文とする。
(単語としてはあいまい性が残っていても後処理によってかなり補完することができることもある:住所認識のような場合)
3次元物体の見え方の例
- 距離・方向によって形状が大きく変わって見える
- あらゆる方向の物体を辞書として登録し、データベースを構築する。ツリー構造サーチを行い認識する。
「役に立つ?」CVシステム
- 自動化や省電力化のためのシステム(従来技術)
- 画像を用いた医療用/工業用検査装置
- 郵便物宛名自動読み取り区分機
- バイオメトリクス個人認証(生態照合)システム
- 顔認識技術
- ITS(高度道路交通システム)
- 車載画像監視技術
動画:フェイスパス(顔画像による認証システム)
- 顔を認識させる(目を基準に顔のポイントを認識する)
- 認証にかかるのは1.2秒
- 髪型を変えたりめがねをかけたり化粧が濃くなっても大丈夫。
- 一卵性双生児程度に似ていると誤認識してしまう(が、デモでは失敗した)。どこかのタレントらしい女の子の双子が出てきた。
- 双子は視聴率が取れるらしい。
- 人間の認識によく似ているので、人間が見て見間違えそうな人は見間違える。
- 顔が少しずつ変化するのである日突然認識に失敗するらしい
なんかニューヨーク同時多発テロの前後に開発完了したりしたらしい。
2005/07/12 朝日新聞朝刊
銀行ATM、生体認証の規格統一 手のひら・指併用
http://www.asahi.com/life/update/0712/002.html
2003/10 朝日新聞
顔の特徴を電子的照合 日立/グローリー工業
2003/12/25 日系産業新聞
東急不、顔認証マンション
東芝らしい
個人認証とは
- 2つの認証機能
- 1対1照合:本人確認(Verification)
- 1対N照合:誰であるか?
- 3つの個人認証方式
- パスワード(記憶によるもの)
- IDカード(所持品によるもの)
- バイオメトリクス(生体情報によるもの)
バイオメトリクス個人認証とは?
- 人間の外見的特徴、あるいは行動特性のうち以下の条件を備えているものを採用
- 普遍性(誰もが持っている特徴である)
- 唯一性(本人以外は同じ特徴を持たない)
- 永続性(時間の経過と共に変化しない)
- 本人の特徴をあらかじめ登録しておき、入力した情報と一致することをもって本人と認証する
例)指紋
100人に1人くらいは上手く行かない。(携帯電話の認証とか)
バイオメトリクス個人認証のモデル
(必要時に認証) 人⇒入力⇒特徴抽出⇒照合⇒アプリケーション
↑
(事前に登録) 人⇒入力⇒特徴抽出⇒記録⇒テンプレート(辞書)
- テンプレートは外に出さない方がいい
- データベースによる管理(サーバで照合):盗聴の危険性がある
- パスワードと異なり、変更することができない(指紋でも指は有限であるので問題がある)
- ICカードによる管理
個人認証方式一覧
方式 | 媒体 | 欠点 |
---|---|---|
記憶方式 | 暗証番号・パスワード | 他人に破られる忘れるなどの心配 |
諸事物方式 | ICカード | 置き忘れ、紛失、盗難などの恐れがある |
行動特性 | 声紋・サイン | 照合誤りの可能性や、経時変化、他人に真似られる恐れがある |
身体特性 | 指紋・網膜・虹彩 | 照合誤りの可能性や、経時変化、怪我などの影響がある |
代表的なバイオメトリクス
生体情報の名前 | 照合内容 | 本人データの入力方法 |
---|---|---|
指紋 | 文様パターン上の端点や、分岐点などの特徴(マニューシャ)情報 | 手を所定の位置に密着させ、CCDセンサにより入力 |
掌形 | 手の幅・高さ、各指の長さ・幅・高さなどの情報 | 手を所定位置におき、上方や速報のCCDカメラにより入力 |
網膜 | 網膜上の欠陥パターンの特徴情報 | 近赤外線をスキャンさせ、その反射光をCCDセンサで受光 |
虹彩 | 動向の開き具合を調節する筋肉パターンの特徴情報 | 所定の離れた位置からCCDカメラにより撮像 |
顔 | 目や口などの配置情報や顔全体の濃淡パターン | 同上。ただし、撮像位置には多少の許容度がある。 |
音声 | 声紋パターン。あるいは声紋パターンの特徴情報 | マイク入力。ただし、発生後が決まっている場合と、適宜指定される場合がある。 |
サイン | 通常、動的なサイン情報(筆記運動パターン)が用いられる | ペンとタブレットを用いたオンライン入力 |
ビデオ
- 虹彩認証のデモ(目を撮影してPCの認証を行う)
- 顔の認証(東芝らしい)
- 登録時に100枚程度の画像を登録し、認証時にそれぞれ全ての画像と照合を行い認証する。
- 声紋を利用したプライバシーの保護
- 目の不自由な人の声紋を利用し、重要書類の読み上げボランティアのデータをデータベースから取得する。
- バイオ認証の課題
- レベルの低い機器を利用した場合、かえってセキュリティの低下を招く恐れがある。
マスコミに取り上げられることは結構多いようです。
最近話題の静脈パターン認証について
指画像の入力方法
- プリズムの上に指を置き、光源からの光を反射させてカメラで撮る。
- 出っ張ってる部分は接触するのでよく反射し、引っ込んでる部分は離れてしまうので乱反射する。
- 指が乾燥しているとプリズム上によくくっつかないので綺麗に取ることができない。
バイオメトリクス各方式の比較
顔認識
デモ:顔の検知
リアルタイムに目と鼻の穴の4点を認識する
顔認識の特徴
- 人間が行っている自然な個人識別手段
- 社会的容認製
- 例)パスポート、運転免許証の顔写真
- 非接触で、身体的な拘束が少ない
最大の利点
-
- 心理的および物理的な負担が少ない
- 全体の処理を高速に行える
製品化されている顔認識技術
顔認識の問題点
問題1:顔向き、(表情の変動)
問題2:髪、化粧、ヒゲ、メガネなどの影響
- メガネの掛けたのととったのと両方とればいいんじゃないって話ではある
問題3:照明環境の変動
解決の基本的考え方
- 従来の方法
- 一枚の画像
- 東芝の方法
- 複数の画像を用いた
顔認識の大まかな手順
- 特徴点の位置情報により画像の正規化
- 目、鼻、口などの位置関係(正規化のために取得している)
- テンプレートとの濃淡パターンマッチング
- カラー画像から濃淡情報を求める(3次元の凹凸に対応する)
顔照合手順
1.開始
2.画像入力
3.顔領域抽出
4.顔特徴点抽出
5.正規化パターン切り出し
(2~5の繰り返しにより)n枚の画像を取得
6.制約相互部分空間法によるパターン照合(データベースと)
顔認識処理の流れ
- カラー画像入力(連続するNフレーム)
- モノクロ画像への変換
- 顔領域の検出
- ピラミッド構造化&テンプレートマッチング
- 顔領域内特徴点抽出
- フィルタリング処理&テンプレートマッチング
- 対称部分画像の切り出し&正規化
- アフィン変換による幾何補正の後に、ヒストグラム計算からの濃度補正
- 特徴強調処理<空間フィルタリング>&特徴パターン抽出
- 顔パターン照合<テンプレートマッチング
- ここでのテンプレートマッチングは統計的パターン処理
顔パターンとは?
画像パターンをラスタスキャンすることにより1次元のベクトル表現を行う
顔領域の検出
- 顔テンプレートで探索
- 部分空間法
特徴点(照合における基準点)の検出方法(ここも東芝独自)
- ステップ1:分離度フィルタ(円形分離度フィルタ)
- 特徴点候補の検出
- 周囲より黒くて丸い点(特徴点後方の検出)
- 適当な点を取り、外側領域と内側領域を(分離度半径を変化させながら)相違度を判定する。(平均濃度を比較する。)
- 簡易な方法なので、候補店が大量に出る
- ステップ2:
- 目、鼻の位置関係を満たすものを選択
- 候補の中から正しい特徴点の選択
- 特徴点の周囲画像のパターン認識
- (辞書を利用する)正の辞書との類似度が高く、負の辞書との類似度が低いものを選択する
- ステップ3:パターン照合による確認
- 再び特徴の確認をする。
顔パターン照合方法の説明図
- 従来(部分空間法)
- 入力ベクトルと、辞書部分空間の重心へのベクトルとの角度を類似度とする。
- 相互部分空間法
- 入力部分空間の重心と、辞書部分空間の重心へのベクトルとの角度を類似度とする。
cosθx1000を「類似度スコア」とする。
動画像による顔商業イメージ
複数のサンプル点を取れば、分布により傾向がわかりやすい(んじゃないかなあ)
顔照合システム(ビデオ)
で、FacePassの話に戻ってくるわけ。
-
- あなたの顔がかぎとなる
- FastLane
- 後ろからついて入ったり(ともづれ)、出ていく人に合わせて入ったり、バリアを意図的に妨害したりする行為に対処できる。
FacePass
ハードウェア構成
- 操作部
- 制御部
- PCボード
- ビデオキャプチャー
- 電源
ソフトウェア構成
- OS: Windows NT embedded
- 周辺部:
- HW制御
- 認証履歴管理
- ユーザ情報管理
- コア部
- 画像入力
- 顔検出
- 照合
- 辞書管理
2001/01/01 東京新聞(横浜・川崎版)
「ハイテクパワーで快適生活」
歩きながら顔認識(FacePassenger)
- 立ち止まる場合との違い
- 顔の向きや照明の変動が大きくなる
- 広視野で高解像度のカメラを使用
- FacePassではQVGA
- FacePassengerでは768x1024
- 3つの位置を設定(遠い順にA,B,C)
- A:顔検出開始
- B:顔の追跡完了(照合に必要なフレーム数を確保)
- C:顔照合を完了
(ビデオ・デモ)
今のところ、特定の方向を向いてもらわないと上手くいかないので画面にユーザの顔を表示してみたりしている。