AbstractClub - 英文技術専門誌の論文・記事の和文要約


[インデックス] [前の年] [次の年]


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.1


決定論的アニーリングを用いたデータクラスタリングによる分類法
Pairwise Data Clustering by Deterministic Annealing

Thomas Hofmann, Student Member, IEEE, and Joachim M. Buhmann, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.1, January 1997

データセットを分割し,その隠れた構造を抽出するという処理は, パターン認識,スピーチ,画像処理といった異なる応用分野において 発生する。 データクラスタリングによる分類は, 似通ったデータから隠れた構造を突き止めるための 組み合わせ的最適化手法である. 本論文では, 最大エントロピーの推論特性の頑健性によるクラスタリング分類 を行う決定論的アニーリング手法について述べる. 得られたGibbs確率分布は,平均場近似により評価される. 相異なるデータを集めてグループ化し,同時にこれらのデータを一つの ユークリッド・ベクトル空間に埋め込むための新しい構造保存型アルゴ リズムが論じられる. このアルゴリズムは,次元を削減してデータを視覚化するのに用いられる. 提案された埋め込みアルゴリズムは,従来手法より優れており, データの相違性−−蛋白質分析から得られたデータと言語学から得られた データ−−を分析するのに実現された. テクスチャを持つ画像を分割するために, 組み合わせ的データ・クラスタリングアルゴリズムを用いた.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


定性的および定量的な3次元復元に基づく障害物の検出
Obstacle Detection Based on Qualitative and Quantitative 3D Reconstruction

Zhongfei Zhang, Richard Weiss, and Allen R. Hanson

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No. 1,January 1997

Keywords: Motion analysis and stereo, qualitative vision, obstacle detection, 3D reconstruction, partial calibration.

本論文では、それぞれ異なる仮定に基づいた3つの異なる障害物検出アルゴリズ ムが述べられている。 最初の2つは定性的であり、視野に障害物が存在するかどうかについて、 yes/noだけを判定し、3次元の復元は行なわないアルゴリズムである。

これらの方法は、線形システムの解決能力に基づき、シーン中の障害物の有無を 早く決定できるという利点がある。1番目の方法はグランド面についての情報 を使うが、2番目の方法はグランド面が平面であると仮定する。

3番目の方法は定量的であり、グランド面を連続的に推定し、シーン中の各点の グランド面からの高さを決定することにより部分的な3次元構造を復元するア ルゴリズムである。 実験結果は、実際のデータとシミュレーション用のデータとで示され、異なるノ イズレベルでの3つのアルゴリズムの性能が比較される。性能のロバスト性か ら3番目のアルゴリズムが他の2つより良好であると結論づけられる。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


指紋におけるマニューシャの濃淡値からの直接検出
Direct Gray-Scale Minutiae Detection In Fingerprints

Dario Maio, Member, IEEE, and Davide Maltoni

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No. 1, January 1997

ほとんどの指紋比較の自動システムは、マニューシャの整合をもとにしている。マ ニューシャは、指紋パターンを形成する尾根線の終点と分岐点である。マニュー シャの自動検出は、低品質の指紋、特に、ノイズやコントラストの欠陥が、マ ニューシャと似たようなピクセル配置を生じさせたり、本当のマニューシャを隠し たりするようなものでは、極端に難しい処理である。これまでの文献ではいくつか の方法が提案されており、互いにかなり異なるものの、それらのすべての方法で は、指紋画像を二値画像に変換している。本研究では、尾根線追跡をもとにして、 マニューシャを濃淡値画像から直接抽出する新しい方法を提案する。それによって 得られた結果を、画像二値化をもとにしたいくつかの方法によって得られたものと 比較する。概念的にはより複雑なものの、効率と頑健度の両方において、提案方法 の性能が優れている。

HN

(c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


物体認識のための赤外線画像の熱物理学的な代数不変性
Thermophysical Algebraic Invariants from Infrared Imagery for Object Recognition

J. Michel, Member, IEEE, N. Nandhakumar, Senior Member, IEEE, and V. Velten, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 1, January 1997

モデルベースのビジョンシステムの開発で重要な問題の一つは、以下のような 特徴を特定することにある。すなわち、観察と情景の条件に不変で、かつ 対象物の異なるクラスに対し異なる値を取るような特徴である。 我々は、不変的な特徴を確立するための新しいアプローチを定式化する。 我々のアプローチはこの分野でユニークである。というのは、このアプローチは、 不変的な特徴の特定にあたり、表面における反射と表面の幾何的要素を考慮するのみ ならず、物体の内部構成および不可視スペクトルで感知される画像に影響しうる 状態をも考慮するからである。 熱物理学的な不変量と呼ばれる新しいタイプの不変量が定義される。 特徴は、イメージ物体の熱物理学的な性質のみの関数として定義される。 このアプローチは、物理学ベースのモデルに基づくものである。 このモデルは、エネルギー保存則を画像化された対象物の表面上に適用することで 導出されたものである。

LXP

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3次元物体の角密度と認識
Angle Densities and Recognition of 3D Objects

R.Malik and T.Whangbo

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 1,January 1997

Keywords: Object recognition, feature variation, computer vision, image understanding, scene analysis, model based recognition, 3D recognition, statistical decisions.

コンピュータ・ビジョンを用いる3次元物体認識は、幾何学的特徴が 視線方向に沿って変わるという事実により、複雑である。 そのような状況における認識アルゴリズム設計の重要因子は、 角度のようにある種クリティカルな特徴の多様さを理解することにある。 本稿では、isotropic view 方向と垂直射影とが与えられた情景における、 二つの角度についての2次元結合密度関数を導出する。 角密度の解析的表現は、表面と物体とを認識するための統計的決定ルール を決めるのに役立つ。 提案方法の有用さを評価するための実験について述べる。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


流れ場からの記号記述の取得:流体モデルに基づく新しいアプローチ
Acquisition of Symbolic Description from Flow Fields: A New Approach Based on a Fluid Model

Hiroki Nogawa, Yoshikazu Nakajima, Yoshinobu Sato and Shinichi Tamura

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 19, No. 1,January 1997

Keywords: Symbolic description, flow field, fluid model, Rankines vortex, physics-based vision.

流れ場からの記号記述を取得する為の、新しいモデルおよび新しい アルゴリズムを提案する。 提案するモデルは物理的データから導かれ、提案するアルゴリズム は正則複素関数理論に基づいている。 提案方式を用いることで、定量的/定性的情報の両方を流れ場から 得ることが出来る。 また、提案方式をシミュレーションデータや実画像に適用し、アル ゴリズムの頑強性を測定した例を論文中に示す。

mNt

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ロバストなSnakeの実装:2重アクティブ輪郭
A Robust Snake Implementation; A Dual Active Contour

Steve R. Gunn and Mark S. Nixon

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 1, January 1997

従来のアクティブ輪郭定式手法は,初期輪郭とパラメータ値の選択が 難しいものであった. 最近の手法は上記の問題の解決を目指しているが,そのぶん他の性能が 犠牲になっている. この初期化問題を解決するために,我々は2重アクティブ輪郭を利用する. これは局所形状モデルを統合したものである. 一つの輪郭は対象特徴の内部から拡張し,他方は外側から縮んでいく. この2つの輪郭が連結することで, ”弱い”エネルギー極小点をリジェクトすることのできる,バランスのとれた手法 を提供する.

(c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3次元ポリゴン線のマッチング
Matching of 3D Polygonal Arcs

D.R.Heisterkamp, and P.Bhattacharya

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 1, January, 1997

本論文では、同じ長さの3次元ポリゴン線の間の距離測度を定義し、この距離測 度が最小となる値は、ある行列のもっとも小さな固有値となることを示す。 これを用いて、不適合の測度、および異なる長さの3次元ポリゴン線の間のマッチン グ アルゴリズムを開発する。

(c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


最近傍識別器設計のためのbootstrap法
A Bootstrap Technique for Nearest Neighbor Classifier Design

Yoshihiko Hamamoto, Member, IEEE Computer Society, Shunji Uchimura, and Shingo Tomita

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 1,January 1997

Keywords: Bootstrap, nearest neighbor classifier, error rate, peaki ng phenomenon, smalltraining sample size, high dimensions, outlier.

最近傍識別器設計のためのbootstrap法を提案する。 我々の主たる関心は、学習サンプルが少ない時にどのように識別器を設計するかと いうことである。 従来のbootstrap法は、置き換えによって学習サンプルを得ていた。 一方、我々の方法は、元の学習サンプルを局所的に組み合わせることで bootstrapサンプルを生成する。 最近傍識別器をbootstrapサンプルに対して設計し、学習サンプルとは 異なるテストサンプルに対してテストを行った。 提案した識別器の性能を、3つの人工的なデータセットと 1つの実データセットに対して示す。 実験結果によると、bootstrapサンプルに対して設計された最近傍識別器は、 従来の1-近傍識別器はもちろん、k-近傍識別器よりも明らかに良い性能を 示すことがわかった。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


プリミティブによる平面体の不変あてはめ
Invariant Fitting of Planar Objects by Primitives

Klaus Voss and Herbert Suesse

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 1,January 1997

Keywords: Invariant fitting, normalization, planar objects, geometr ical primitives, invariant features, affine transformations, canonical frame, moments.

パターン認識において、不変な特性量を決定することは重要な問題であり、 正規化の手法を用いて得られた多くの不変量が知られている。 本論文では、正規化の手法を用いて、プリミティブによる(例えば直線や 三角形や、矩形、円、楕円、超2次曲線、等による)平面体のあてはめの新しい アプローチを導入する。 物体とプリミティブは特徴量、例えばモーメントによって記述される。 その主な利点は、正規化プロセスが物体とプリミティブの正準構造を 与えてくれることである。 それゆえ、用いられる変換に関して、あてはめが不変になる。 この新しい方法によって、非解析的な物体に解析的な形状、例えば 多角形をあてはめることができるようになる。 さらに、物体とプリミティブの正規化を行なうことにより、数値計算の量を 劇的に減らすことができる。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


モーメントを保存した信号と画像の区分線形近似
Moment-Preserving Piecewise Linear Approximations of Signals and Images

Thai B. Nguyen, Member, IEEE, and B. John Oommen, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No. 1, January 1997

Keywords: Signal processing, image processing, sampling, approximation, moment-preserving approximations.

デジタル信号や画像処理においては近似手法は重要である. フーリエ変換、離散コサイン変換などの多くの非可逆信号圧縮は、 ある信号は原信号を近似した少数の変換係数で表現できる というアイデアに基づいている. 今までの近似手法は、この問題に時間/空間領域または変換領域から のみアプローチし、両方の領域からアプローチしたものはない. 本論文では、これまでの近似手法について簡単に述べる. 続いて、 変数xの領域において元関数に十分に近く,近似を行う際, いくつかの領域変換の特性を正確に維持できる新しい手法を提案する. 特に、この方法で維持される変換値の特性は元関数の幾何学的モーメントである. 提案手法は1変数関数,2次元上の曲線,2次元画像について適用され, その結果が示される.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ソフトな決定の統合を使った非構造化化ドキュメントの多重スケール ・セグメンテーション
Multiscale Segmentation of Unstructured Document Pages Using Soft Decision Integration

Kamran Etemad, David Doermann, and Rama Chellappa

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 1,January 1997

Keywords: Document processing, multiscale analysis, context depende nt classification, soft decision integration, wavelet packets, neural networks.

レイアウトに依存しないセグメンテーションのアルゴリズムを述べる。 これは、ドキュメントのテクスチャーに基づくものであり、多重スケール の特徴ベクトルと、局所的なファジー決定情報を用いている。 多重スケールの特徴ベクトルは、ソフトでファジーなマルチクラスのメンバー シップが割り当てられるようにニューラルネットを使って局所的にクラスタリ ングされる。 セグメンテーションは、その曖昧さを減らすようにソフトで局所的な決定ベク トルを統合することで実行される。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.2


観測画像の尤度と安定度について
On View Likelihood and Stability

Daphna Weinshall, Member, IEEE, and Michael Werman, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2, February 1997

観測画像の尤度と安定度という、観測画像に関する2つの尺度定義する。観測画像 の尤度は、当たられた3次元物体に対して、ある特定の観測画像が得られる確率を 測るものである。それは、典型的、あるいは、「特性的」な観測画像を特定するた めに使うこともできる。観測画像の安定度は、視点がわずかに変動したときに、画 像がどれだけ小さく変化するかを測るものである。それは、「包括的」な観測画像 を特定するために使うこともできる。両方の定義が、カメラ方向の事前確率と同一 であり、画像を比較するために使う2次元計量によって決定されることを示す。2 つの特徴をもとにした2次元計量に対する安定度と尤度の尺度を解析的に導き出 し、一番安定で尤もらしい観測画像は、3次元形状のもっとも均一な観測画像であ ることを示す。

3次元物体認識と3次元再構築に観測画像の尤度と安定度を取り入れることによ り、性能の頑健性が向上する。特に、すべての実現可能解から一番尤もらしい解を 選び出す第2段階の処理を付加することにより、3次元物体認識と3次元再構築の アルゴリズムを向上させるのに、これらの尺度を使うことを提案する。これらの応 用をシミュレーション画像と実画像を使って例示する。

HN

(c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


確率論的な多重スケールの画像分割
Probabilistic Multiscale Image Segmentation

Koen L. Vincken, Member, IEEE Computer Society, AndrS.E. Koster, an d Max A.Viergever

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2,February 1997 SUMMARYS: 確率論的な連結の多重スケール(ハイパースタック)アプローチを用いた 多次元画像の切り出し方法を提示する。 ハイパースタックとは、voxelベースの多重スケールデータ構造であり、そのレベル は幅の増加するガウシアンカーネルで元画像を畳み込んで構築される。 隣接するスケールレベルのvoxelsの間では、親子間の連結はモデル方向の連結 スキーマによって確立される。 このように得られたツリー状のデータ構造において、ルート(根)は 単一voxelで表現されるオリジナル画像中の区切りのもっともらしい場所を指示する ように形成される。 最終的な切り出しは、全部のルートの連結を後ろ向きに追跡することで得られる。 本論文は、確率論的(あるいは多重親)連結を扱う。 すなわち、一個の子voxelは一個以上の親voxelに連結できるような構成である。 多重親連結構造は確率のリストに変換される。 このリストは、どのvoxelがどの程度で 部分容量(partial volume)のvoxelであるかを表現できる。 確率地図が作られることで、スケール空間において 密から疎なスケールへ向かうときの弱い連結の進展が可視化される。 これは、適切な切り出しが困難であるvoxelの検出において貴重な道具である、 ということが示される。 確率論的ハイパースタックの出力は、容量表現に使用される不透明さに直接に 関連付けられうる。 人工的な画像と(医学の)実画像との両方に対する結果を示す。 通常の(単一親)連結に比べて、確率論的連結は切り出しに著しい改善を もたらしたことが示される。 この改善は、ある客観的な評価方法により、定量的に裏付けられる。

LXP

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ユーザ・スケッチの弾性的マッチングによる視覚的画像検索
Visual Image Retrieval by Elastic Matching of User Sketches

Alberto Del Bimbo

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2, February 1997

Keywords: Image database, image retrieval by sketch, shape similarity-based retrieval, elastic matching.

データベースから内容に基づいた画像検索を有効に行うためには、 画像データを適切にインデクス付けして復元するのに用いられる情報が、 テキスト状のラベルではなくて視覚的な画像特性であることが要請される。 ユーザ・スケッチ・テンプレートが与えられるときの、形状の類似性に 基づく検索というのは、特に挑戦的である。というのは、人間による類 似性の共通認識にきわめて適合するような類似性の尺度を導くことが 難しいからである。 本論文では、類似性の順位を評価するための一つの技法について述べる。 それは、画像における形状の上をなぞるようにスケッチされたテンプレート の弾性的マッチングに基づいている。 取られたマッチングの度合いと、そのような整合を取るためのスケッチに 費やされる弾性的変形エネルギーとが、 スケッチとデータベース内画像との類似性の尺度を導出し、 表示される画像を順位づけるのに用いられる。 弾性的マッチングは、スケール不変性をもたらし、かつ複数対象物の問い における対象物の間の空間的な関連を考慮するように統合される。 試作システムによる例は、このアプローチの有効性に関する熟考や、 比較による性能分析とともに、詳しく述べられる。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


基本行列から導かれる Kruppa's 方程式
Kruppa's Equations Derived from the Fundamental Matrix

Richard I. Hartley

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 19, No. 2,February 1997

Keywords: Singular value decomposition, fundamental matrix, Kruppa's equations, camera calibration

本論文の目的は、基本行列の型で Kruppa's 方程式に特定の形式を与えることである 。 Kruppa's 方程式は、基本行列の特異値分解の形式で明確に表現出来る。

mNt

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ノイズ耐性の高いモーメントベースの画像正規化
Moment-Based Image Normalization With High Noise-Tolerance

Matthias Gruber and Ken-Yuh Hsu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2,February 1997

本論文では, 既存のモーメントベースの画像正規化手法における平均値が非ゼロのノイズ の影響について述べる. ノイズの影響を軽減するいくつかの改良について実験と共に示す. この改良は非線形写像と,部分的なそして負オーダーのモーメントを含む.

(c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


弱遠近法下でのオプティカルフローからの剛体の分割と形の記述
Rigid Body Segmentation and Shape Description from Dense Optical Flow Under Weak Perspective

J.Weber, and J.Malik

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2, February, 1997

本論文では、オプティカルフローから、独立に動いている剛体を特定し追跡する アルゴリズムを表す。 オプティカルフローから分離することに関する従来のいくつかの試みは、フロー の場における不連続を見つけることに重きを置いていた。 不連続はあくまでシーンの深さの変化を指し示すものであり、一般に、二つの分 離した物体の境界線を表すものではない。 提案方法では、それぞれ独立に動いている物体が、その動きに関してその物体 特有のエピポーラー拘束条件をもつという事実を利用している。 こうして、物体それ自体の隠蔽にもとづく動きの不連続は、分離した物体のため の拘束条件から決定され得る。 エピポーラー幾何学の利用は、各物体個々の運動パラメーターの決定に加え、物 体上の各点の相対的な深さを再現することを可能にする。 アルゴリズムでは、遠近法の効果がすべてのスケールにわたって変化することを 制限された、アフィンカメラを仮定している。 カメラの補正パラメーターは不要である。 カルマンフィルターにもとづく方法が、運動パラメーターの追跡に用いられる。

(c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


対称性の分割ベース解析とその応用
Division-Based Analysis of Symmetry and Its Application

Shigehiro Fukushima, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2,February 1997

Keywords: Computer vision, symmetric axis, symmetric points, comput ational geometry, Voronoi diagram, Delaunay triangulation, generalized cylinder, shape analysis.

単純に連結された曲線で閉じられた平面の対称性解析のための 計算手法(DAS)を提案する。 DASは、2つの幾何学的な平面の分割の2重性、Delaunay3角形分割 およびボロノイ図に基づいて、対称軸と曲線の対称点の組の両方を 矛盾なく決定する。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


窓付きフーリエフィルタを用いたテクスチャ分類
Texture Classification Using Windowed Fourier Filters

Robert Azencott, Jia-Ping Wang, and Laurent Younes

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2,February 1997

Keywords: Texture attributes and classification, windowed Fourier filters, Gabor filters,Gaussian random fields, spectral density, Kullback distance, distance between textures,segmentation of textured images.

窓付きフーリエフィルタにもとづくテクスチャ特徴から、 分類のためのテクスチャ間距離を定義する。 距離の定義は、そのテクスチャがガウシアンランダム場と考えられるときの スペクトル密度の観点からくるテクスチャ属性値の解釈に依存する。 するとテクスチャ間距離は対称化Kullback距離として定義される。それは 属性値の簡単な関数であり、いかなる正規化も必要としない。 Gaborフィルタを用いた実験的解析から、特に2次の距離と比較すると、 本手法が有効かつロバストであることが示された。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


特徴選択:評価,応用および小さなサンプルにおけるパフォーマンス
Feature Selection:Evaluation, Application, and Small Sample Performance

Anil Jain and Douglas Zongker

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2,February 1997

Keywords: Feature selection, curse of dimensionality, genetic algor ithm, node pruning, texture models, SAR image classification.

特徴の部分集合を選択するための,数多くのアルゴリズムがこれまでに 提案されてきた. 我々による実験の結果, Pudilらにより提案された sequential forward floating selection (SFFS) アルゴリズムが他のものよりも優れていることがわかった. 4種のテクスチャモデルを用いたSAR衛星画像に基づく土地分類のための 最適特徴の選択について研究がなされた. 特徴選択に続いて,異なったテクスチャモデルから得られる特徴を蓄えること により,分類の正確さに大きな改善が見られる。 最後に,少ないサンプルの場合の特徴選択手法の適用に危険があることをも 示す.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


カメラ位置制御により多面体物体の真の角度を決定するための視点制 御の計画方法
A Viewpoint Planning Strategy for Determining True Angles on Polyhedral Objects by Camera Alignment

Claus B. Madsen and Henrik I. Christensen

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2,February 1997

Keywords: Active vision, viewpoint planning, camera alignment, angle.

本論文は、光軸が多面体の物体の任意の2つのエッジの交差、すなわち接合点 によって張られる平面に垂直であるように任意の位置から位置へカメラが自動 的に動く場合の視点制御の計画方法について述べる。 従来の研究ではそのような制御を行なうためにエッジの長さを変えるという方 法が共通に使われるが、本研究では接合点のエッジ間の正確な角度を使用する ことが示される。正確な角度の制御に基づくことにより、物体までの距離と焦 点距離に独立なほどロバスト性が高まる。

この方法では約1°の正確さで接合点の角度が決定でき、約6°の正確さでカ メラ位置が決定できる。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


拡張ガウシアン画像を用いた3次元対称性検出
3D Symmetry Detection Using The Extended Gaussian Image

Changming Sun and Jamie Sherrah

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2, February 1997

対称性の検出はコンピュータ・ヴィジョンの分野で重要である。本研究では、3次 元の対称性検出のアルゴリズムを示す。対称性検出問題をガウシアン画像の相関に 変換する。いったん物体のガウシアン画像が得られれば、アルゴリズムは入力の形 式に独立である。アルゴリズムは異なる種類の画像や物体を取り扱うことができ る。シミュレーション画像と実画像を様々な形式でテストし、その結果、ガウシア ン画像を使って対称性が決定できることが示される。

HN

(c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一般化されたポテンシャル場モデルを用いた形状表現
Shape Representation Using a Generalized Potential Field Model

Narendra Ahuja, Fellow, IEEE, and Jen-Hui Chuang, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2,February 1997

本論文は、2次元多角形領域の中心軸変換の効率的な導出について論じる。 計算効率のため、領域境界までの最短距離の代わりに、ポテンシャル場モデルが 使われる。 領域の境界は充電されていると仮定し、得られたポテンシャル場の谷は中心軸変換の 軸の推定に用いられる。 ポテンシャルの谷はその後の力場で見つけられるため、2次元探索を回避 することができる。 ポテンシャル場は、境界セグメントの方程式を用いて閉じた形で計算される。

単純なニュートンポテンシャルは、この目的において不適切であることを示す。 より高い階数のポテンシャルが定義される。この定義されたものは、距離の逆数より 距離に対して速く減衰する。 このポテンシャルの階数が任意大になるとき、得られた軸は境界までの最短距離で 計算された軸に近づく。 軸を計算するアルゴリズムが提示される。これらの軸の一部分の初期値が推測されて いるため、このアルゴリズムは線形並列時間で実行される。 いくつかの事例の実験結果を提示する。

LXP

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


クラスターベースのテンプレートを用いた文書画像からのスクリプト自動同定
Automatic Script Identification From Document Images Using Cluster-Based Templates

Judith Hochberg, Patrick Kelly, Timothy Thomas, and Lila Kerns

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2,February 1997

Keywords: Script identification, document analysis, optical character recognition.

本稿では、活字文書画像のためのスクリプト自動同定システムについて 述べる。 各々のスクリプトのテンプレートは、学習セットから得られる テキスト状の記号をクラスタリングすることで、求められる。 新しい画像から得られる記号は、テンプレートと比較され、最もよい スクリプトが検出される。 現行システムは13のスクリプトを処理するが、最小限の前処理で 高い精度をもつ。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Indian 文書画像の傾き角度検出
Skew Angle Detection of Digitized Indian Script Documents

B.B. Chaudhuri and U. Pal

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 19, No. 2,February 1997

Keywords: Document processing, skew detection, optical character recognition (OCR),document structure analysis, digital library.

最も広く使われている Indian 文字である Devnagari と Bangla の 文書画像に対する、傾き角度検出方法について述べる。 これらの文書において、ほとんどの文字はヘッドラインと呼ばれる 水平線をその上部に持つ。 通常、ヘッドラインは単語中で連結しているので、単語は1つの要素として現れる。 提案する方式では、この要素の抽出を最初に行なう。 次に、要素上部の疑似水平線から列方向のスキャンを行なうことで、 要素の上部の線分を探索する。 そこで、デジタル直線の特性を満たす部分を検出することで、要素上部 の線分が検出される。 検出された線分は1つのテキスト行に属するものとして分類される。 最後に個々の行毎に算出された傾き角度を統合して、全体の傾き角度を得る。 精度や効果とは別に、本方式ではヘッドラインの情報から容易に文 字切り出しと文字領域検出が行なえるという利点がある。 これらの情報は文書の文字認識処理にとって有用な情報である。

mNt

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


分類構造の除去による2クラスの線形判別分析
Linear Discriminant Analysis for Two Classes via Removal of Classification Structure

Mayer Aladjem

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 2,February 1997

新しい2クラスの線形判別分析の方法,”分類構造の除去”を提案する. この手法の新規性は,特定された判別方向に沿ってデータを判別情報の ないものへと変換することと,次の判別方向を得るための反復にある。 互いに斜行する判別方向を探索するのも自由であり,また,検出済みの 方向が後のステージで再び選ばれることのないことが保証されている. 本手法の効力は,2つの判別基準で調べられる. スペクトル幅の広い人工データと実データとを対象に調べた結果、 この基準による判別品質が本手法によって改善され得ることが 示される.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.3


自律的な探索:不確実性による運転
Autonomous Exploration: Driven by Uncertainty

P.Whaite, and F.P.Ferrie

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3 ,March, 1997

我々が得ているデータが常に不完全であるように、外界の受動的な計測は不十分 なものであり、そこからの推定がしばしば受け入れ難いほどの不確かさとなる。 もし自律的に作動する機械をつくろうとするならば、常にこのジレンマに直面し、 より多くの能動的な役割を果たすようにするときにのみ成功し得る。 本論文では、そのような機械について述べる。 それは、内部表現の正確さが最大となるよう外界のパーツを慎重に探し出し、そ の表現が許容し得るものとなるまで探索を続行する。 我々は、このパラダイムを自律的探索と呼び、その機械を自律的探査機と呼ぶ。 本論文では、二つの大きな貢献点をもつ。 一つめは、どのように探索するかを知らせる理論であり、我々が以前に進めてい た、直観的なアイデアを確証するものである。 二つめは、その理論の実現である。 我々の研究室で、動く自律的探索機を作成し、初めてそれが動くのが見られる。 システムは完全にボトムアップ型であり、環境に関するいかなる前提知識にも依 存しない。 我々の知るところでは、注視の計画と複雑な三次元モデルの推定とのつながりの 輪を閉じるのに成功した最初の例である。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


形と動きの再現のための擬似中心射影因子分解法
A Paraperspective Factorization Method for Shape and Motion Recovery

Conrad J. Poelman and Takeo Kanade, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3, March 1997

Keywords: Motion analysis, shape recovery, factorization method, three-dimensional vision, image sequence analysis, singular value decomposition.

Tomasi と Kanade によって開発された因子分解法は、画像シーケンスから 物体の形と動きを再現できる。 この方法は、非常に冗長な特徴となる位置の情報を得るために、 たくさんの画像を使い、たくさんの特徴点を追跡する。 この方法は、直交射影の線形代数の特性と特異値分解(SVD)を利用し、 ロバストに軌道情報を求めることができる。 しかしながら、直交方程式はその方法が扱える動きの範囲を制限する。 Ohta によって初めて紹介された擬似中心射影は、直交射影の基にモデリング されたのではない幾つかの効果をモデリングすることによって中心射影を 良く近似する射影モデルであり、一方では線形代数の特性を保っている。 我々の擬似中心射影法は、カメラの方に向かう動きや低空の飛行機から撮影した 地形の航空画像を含む画像シーケンスなどのような、非常に広い動きの範囲に 適用できる。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3次元運動のアクティブな復元および予測への利用
The Active Recovery of 3D Motion Trajectories and Their Use in Prediction

Kevin J. Bradshaw, Ian D. Reid, Member, IEEE, and David W. Murray, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3, March 1997

Keywords: Active vision, active camera platform, visual tracking, ground plane motion, interacting filters, prediction.

本論文は、面上の軌跡を復元する方法、および視覚的フィードバックループ における遅延の間の予測を容易にするためにそれらの軌跡を用いる方法に 関する、理論とアクティブカメラを用いたリアルタイムな実装について 述べる。 軌跡をたどるための画像上の位置と速度は、画像の中央の領域にある オプティカルフローを検出して分割することによって生成され、 投影的な情報を用いてカメラのジョイント角をシーンの中の平面、典型的には 地表面上のユークリッド座標へ写像する。 軌跡を解析するために、異なるダイナミクスを持つ拡張カルマンフィルタの組が 適用され、それらが競合することによって相互作用多体モデルの中で最適な 運動記述が与えられる。 見た目の遅れに対処するため、最適な運動モデルからの予測を、視覚的 フィードバックループの中で用いた。 3次元内で平面記述をして予測する方が、観測者に対する2次元運動の軌跡の フィルタリングされた記述にもとづいて予測するよりも追跡性能がよいこと を示す。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スクリプトの決定と文書画像の言語コンテンツ
Determination of the Script and Language Content of Document Images

A. Lawrence Spitz, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3,March 1997

Keywords: Multilingual, script classification, machine printed OCR, language classification,Han-based languages, Latin-based languages, Asian scripts.

現在行われている文書認識のほとんどは,英文に対するものである. 英語と大部分の西ヨーロッパの言語(フランス語,ドイツ語など)の 文字には多くの共通性があるので,英文に対するものを少し拡張すれば これら西ヨーロッパの言語に応用できる. とはいえ、今のところ光学式文字認識に先だって自動言語識別を行う ことはできず,あくまでもこれらのシステム(光学式文字認識)に有 用性を与えるものである.

言語とそのスクリプトには,記述言語の決定を可能にするような特性がある. これらの特性値を見つけるためには,文書画像の特定の特徴を認識する必要がある. ラテン系文字を持つ言語の場合は,言語に依存した文字シンタックスも必要となる.

我々は,テキスト画像においてどの言語で書かれているかを 見分ける方法について研究を行ってきた. この研究の対象は小さなものに限られていたが, 世界の多くの言語の部分集合にとって重要なものである. この方法は,まずはじめに スクリプトをハン系とラテン系に大きく分類する. この分類は,文字構造の上方向へのくぼみを利用して行われる. ハン系スクリプトクラス(中国語,日本語,朝鮮語)の同定は テキスト画像の光学的濃度の分布の分析により行われる. 23のラテン系言語について文字形状コードに基づいた方法を適用し, ラテン系テキストについては計算コストが大きくないことがわかった.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


"連続的な特徴量としての対称性"についてのコメント
Comments on "Symmetry as a Continuous Feature"

Kenichi Kanatani, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3,March 1997

Keywords: Symmetry detection, shape classification, pattern recogni tion, geometric AIC, statistical analysis.

Zabrodskyらによって研究された対称性の検出には理論的に困難な部分が存在 することを指摘し、それに対する可能な解決方法を述べる。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一般両眼視幾何におけるパッチをもとにしたステレオ
Patch-Based Stereo in a General Binocular Viewing Geometry

Boaz J. Super, Member, IEEE, and William N. Klarquist, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3, March 1997

本論文では、画像パッチの輝度情報の整合から3次元曲面の平面パッチを直接生成 する、1段階のステレオのアルゴリズムを示す。その方法は、カメラ間の任意の回 転と移動を許容し、軸の並行性、ベースラインの狭さや両眼転導の幾何的制約はな い。そのアプローチのキーポイントは、仮定された表面パッチと矛盾なく一致し た、位置、形状、大きさ、方向、そして、サンプリングを持つ画像パッチを整合す ることにある。そして、整合の誤差は、パッチの内容の整合ミスだけに影響し、 パッチの形やサンプリングの整合ミスには影響しない。異なる視点からの実画像を 使って、アルゴリズムを正解と照らし合わせて定量的に評価する。その結果、表面 深さの推定においては平均約1%、表面法線方向の推定においては平均10度の精度 が得られた。

HN

(c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


時間と視点の変化する画像系列からの非剛体的移動物体の3Dモデルの獲得: 左心室再構成への一歩
Acquiring 3D Models of Non-Rigid Moving Objects From Time and Viewpoint Varying Image Sequences: A Step Toward Left Ventricle Recovery

Yoshinobu Sato, Masamitsu Moriyama, Masayuki Hanayama, Hiroaki Naito, and Shinich Tamura

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3,March 1997

本論文は、視点と時間の異なる画像から、既知の周期で時間変化する3D 形状の正確な復元方法を述べる。その目的は左心室の形状の復元である。 我々の復元方法は、異なる視点から見た明白な輪郭を統合することに基づいている。 X線撮影心電図から抽出した断片的な輪郭に対処できるように、上述の方法を B-スプラインに基づく4D閉表面モデルに直接に適用した。 合成画像系列と実画像系列とを用いて、この方法を定量的に評価する。

LXP

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


距離データから Volumetric Parts を復元するモデル・ベース領域分割の役割
The Role of Model-Based Segmentation in the Recovery of Volumetric Parts From Range Data

Sven J. Dickinson, Dimitri Metaxas, and Alex Pentland

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3,March 1997

Keywords: Shape recovery, range data, volumetric parts, model-based segmentation, object recognition, deformable superquadrics.

本論文では、距離データから3次元対象物の形状を切り出して推定する 一つの方法について述べる。 この技法は、モデルのビューつまりアスペクトを用いることで、変形可能モデルを 距離データに合わせるときの制限付けを行う。 まず、距離画像の初期的な領域分割結果が求められ、これに基づいて、 領域は、対象物を構成する volumetric parts に一致するアスペクトへと、 グループ化される。 距離画像を定性的に領域分割して volumetric parts を求めることは、 各部品の粗い形状を捉えるのみならず、 各部品の向きをそのアスペクトを通じて定性的に符号化することに相当する。 そのアスペクトにおける表面と、その部品の表面との間のマッピングのみならず、 部品の粗い形状の知識、その向きが、 変形可能モデル(大局的変形と局所的変形の双方をサポートする)を データに合わせるときの強い制限をもたらす。 物理学に基づいた距離データからの変形可能モデル復元における これまでの研究とは異なり、この技法はあらかじめ領域分割され たデータを必要としない。 さらには、隠蔽は領域分割時に取り扱われ、形状当てはめ処理を複雑にしない。 というのは、部品に属することが既知の3次元点のみが、モデルの部品当てはめ に使われるからである。 このアプローチについて詳しく述べ、距離データからの対象物復元に適用する。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


領域の位置合わせを用いたエゴモーションの復元
Recovery of Ego-Motion Using Region Alignment

Michal Irani, Benny Rousso and Shmuel Peleg

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 19, No. 3, March 1997

Keywords: Motion analysis, ego motion, video stabilization, plane-plus-parallax.

動きの無い情景における3次元カメラの動き(the ego-motion) 算出手法について述べる。 まず、検出された2つのフレーム間の2次元動きを用いて、 対応するイメージ領域の位置合わせを行う。 そのような2次元の記録が、カメラの回転の影響をすべて取り除くことを 証明する。それは、たとえ位置合わせ誤りの残る画像領域に対してもである。 次に、領域間の対応付けのなされた2つの画像間での視差残差置換場が FOEを中心としたエピポーラ場を形成することを示す。 そのエピポーラ場から3次元カメラ動きを算出でき、 3次元カメラの回転は、計算により求めた3次元変換と検出された 2次元動きから算出される。 画像の動きを2次元パラメータ動きと視差残差置換場へと分解することで、 画像の動きを回転と移動に分解することにより生じる多くの固有の曖昧 さと不安定さを避け、 3次元動きの算出の頑強性が高められることを示す。

mNt

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


高速なボトムアップ型文書レイアウト解析
A Fast Algorithm for Bottom-Up Document Layout Analysis

AnikSimon, Jean-Christophe Pret, and A. Peter Johnson

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3,March 1997

新しいボトムアップ型文書レイアウト解析手法について提案する. 本アルゴリズムは,CLiDE(科学文献データ抽出:Chemical Literature Data Extraction)システム (http://chem.leeds.ac.uk/ICAMS/CLiDE.html) に実装済みであるが,ここで述べられる方法についていえば,より広い 種類の文書に適用可能である. このアルゴリズムはKruskalのアルゴリズムをベースとしており, ページ構造を構築する要素間の距離として特別な基準を使用している. 本手法は,「テキストスペーシングに依存しない」であるとか, 「ブロックの揃い方に依存しない」などのボトムアップ手法の持つ主な利点 をすべて持つ. 経験的手法やパス圧縮によって,本アルゴリズムの計算量は線形に削減される.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


最近傍分類器に関する高速アルゴリズム
A Fast Algorithm for the Nearest-Neighbor Classifier

A.Djouadi and E.Bouktache

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3, March, 1997

ラベル付けされた既知サンプル集合から、未知のサンプルの最近傍を見つけ るための高速アルゴリズムを提案する。 このアルゴリズムは、まったく適度な前処理の労力と、かなり多くの記憶容量 を必要とするが、分類にあてる計算量のかなりの削減を達成する。 アルゴリズムのパフォーマンスについての記述、および従来のものとの比較が 示される。 シミュレーションデータによる結果は、この高速アルゴリズムを用いて達成され 得る計算量の削減の例証を与えている。


行列の数列の同時対角化のための適応的な確率過程的近似アルゴリズムと応用
An Adaptive Stochastic Approximation Algorithm for Simultaneous Diagonalization of Matrix Sequences With Applications

Chanchal Chatterjee and Vwani P. Roychowdhury

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 3,March 1997

Keywords: Adaptive generalized eigen-decomposition, interference cancellation.

統計的な近似理論に基づいた適応的なアルゴリズムについて述べる。 このアルゴリズムは2つのランダム行列の数列の期待値の同時対角化 のためのものである。 この問題を解く方法が既にいくつかあり、パターン解析や信号検出など多くの応用 があるが、それらはオンライン(即ち、実時間)処理が必要になる。 これらの応用において、2つのランダム行列の数列{Ak}と{Bk}がオンラインの 観測データとして与えられており、

lim E[Ak] = A 及び lim E[Bk] = B であるとする。

k→∞ k→∞

ここで、AとBは実正定値である。

各サンプル(Ak, Bk)に対して、固有ベクトルFと固有値Lとの推定量FkとLk がそれぞれ必要となる。 FkとLkをそれぞれFとLに、確率1で収束させるアルゴリズムについて述べる。 本アルゴリズムで用いる新しい計算手法は、適応的な計算である。 さらに、一般化固有値分解問題におけるこのアルゴリズムの使用に加えて、 この処理は自身の幾つかの特徴抽出問題にも使える。 本アルゴリズムの性能を、デジタルのモバイル通信における妨害やノイズを含む 高次元の信号を検出する例を用いて示す。 計算の複雑度と性能の比較実験を通して、 実時間の応用における本アルゴリズムの効果を示す。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.4


物体認識におけるガウシアン誤りの効果
The Effect of Gaussian Error in Object Recognition

Karen B. Sarachik

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.4, April 1997

Keywords: Gaussian error models, object recognition, error analysis.

モデルに基づく認識方法において、そのゴールは画像中に1つかそれ以上の既 知の物体の例を位置付けることである。この問題は、物体の存在を認識するこ と自体を間違えらせるネガティブな誤りであるクラッター、オクルージョン、 センサーエラーとアルゴリズム自体が物体の存在を正しく識別できないポジティ ブな誤りが混在している。どちらの場合の確率も認識アルゴリズム内部のパラ メータによって影響され、そのパラメータはほとんどいつもアドホックに選ば れる。認識アルゴリズムが間違える可能性におけるパラメータの値の影響はい つも明示的にはわからない。

この問題に対処するために我々は明示的に画像中で生じるノイズをモデル化す る。典型的な認識アルゴリズムにおいては、物体の位置についての仮説は画像 中の証拠に対してテストされ、すべてのスコアが各々の仮説に付けられる。我々 は正しいあるいは正しくない仮説が持ちそうなスコアはどんなものかを決定す るために統計的なモデルを用い、正しくない仮説の中から正しいものを見分け るために標準的な"binary hypotheses testing technique"を使用する。

このアプローチを使えば、アルゴリズムとノイズモデルを比較でき、誤る確率 を最小にする内部のしきい値を自動的に選択できる。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


オンライン指紋照合
On-Line Fingerprint Verification

Anil Jain, Lin Hong, and Ruud Bolle

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.4, April 1997.

Keywords: Biometrics, fingerprints, matching, verification, minutia,orientation field, ridge extraction.

指紋照合はもっとも信頼性が高い個人識別方法の一つである。 しかしながら、人手による指紋照合は、単調で退屈な作業であり、 時間と費用がかかるので、 性能に対する、今日の増大している要求を満たすことはできない。 自動指紋識別システム(AFIS)が広く必要とされており、 犯罪者識別、アクセス制御、ATMカード識別のような、 法廷や民生への応用において非常に重要な役割を演ずる。 本論文では、マニューシャ抽出とマニューシャ・マッチングの2段階の処理から成 る、 オンライン指紋照合システムの設計と実装について述べる。 Ratha等によって提案された、オンラインのインクレス・スキャナによって 入力された指紋画像から特徴を抽出するための、マニューシャ抽出アルゴリズムの 改良版 (はるかに速く、信頼性が高い)を実装する。 マニューシャ・マッチングでは、配置をもとにした弾性マッチングのアルゴリズム を開発した。 このアルゴリズムは、総当たり探索に頼ることなく、入力画像と蓄積されたテンプ レートの マニューシャの間の対応を見つけることができ、指紋間の非線形的変形と不正確な 変換を 適応的に補正することができる。 システムを、インクレス・スキャナによって入力された2組の指紋画像についてテ ストした。 照合精度は許容できる範囲である。 通常、SPARC 20ワークステーション上で、指紋照合手続き全体は、平均で、約8秒 かかる。 これらの実験結果は、我々のシステムが、高い精度を保ちながら、 オンライン照合の応答時間に対する要求を満たしていることを示している。

HN

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


多面体の有限解像度のアスペクト・グラフ
Finite-Resolution Aspect Graphs of Polyhedral Objects

Ilan Shimshoni and Jean Ponce

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 4, April 1997

本論文では、多面体のアスペクト・グラフの計算問題について論ずる。この 多面体は空間解像度が限定されている直交投影カメラによって観察されるため、 画像中の2点の距離が事前に設定されたしきい値より近い場合、それらを 分別できない。 このモデルにおいて、通常の直角投影で異なるはずの画面は同等になって、 一方、画面空間の有限領域で「偶然」画面の発生もありうる。 我々は多面体の可視イベントのカタログを提示し、アスペクト・グラフの 計算アルゴリズムを与えて、すべての質的に異なるアスペクトを列挙する。 このアルゴリズムは完全に実現され、計算結果も提示される。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Facetモデルとパラメータ化された弛緩ラベリングとを用いる エッジ検出技法
An Edge Detection Technique Using the Facet Model and Parameterized Relaxation Labeling

Ioannis Matalas, Student Member, IEEE, Ralph Benjamin, and Richard Kitney

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 4, April 1997

Keywords: Edge detection, relaxation labeling, facet model, curve enhancement, computer vision, image analysis.

ディジタル濃淡画像から、エッジ構造を検出してラベリングするための 方法について述べる。 この方法は、二つの処理段階に分けられる。 最初に、推定エッジ点の位置と方向、および曲率を検出するのに、 いくつかの3次facetモデルを適用する。 次に、弛緩ラベリング・ネットワークを用いることで、 意味あるエッジ構造を補強するいっぽう、ノイズ的な エッジの抑制を図る。 このネットワークにおいて、各ノードのラベルは、 対応するエッジ点の方向と曲率の情報をパラメータ化した3次元 ベクトルである。 弛緩過程におけるヒステリシス・ステップでは、連結する輪郭成分の 最大化を図る。 ある種の画像については、前もって適応的な平滑化を行うことが、 ノイズや空間的なぼけに対する頑強さを増すのにつながる。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像処理における非線形異方性拡散の整数方程式近似の学習
Learning an Integral Equation Approximation to Nonlinear Anisotropic Diffusion in Image Processing

Bruce Fischl and Eric L. Schwartz

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.4, April 1997

Keywords: Anisotropic diffusion, image enhancement, nonlinear filtering,noise reduction.

マルチスケール画像における画像の強調と表現は医療画像システム あるいはマシンビジョンシステムにおいて重要である。 この表現の構築過程は高速かつノイズに対する頑強性が高いことが要求される。 またこの表現はあらゆるスケールにおいて同一である必要がある。 微小な構造はノイズと識別することが困難であり、 一方大きなスケールにおいて構造を得る場合には計算量が多くなるため、 表現構築の過程は複雑なものとなる。 上記いずれの場合にも、局所化の問題が発生する。 異なるスケール間での結果が異なり、整合をとる必要が生じた際に、 誤りが生じるのである。 これまで、マルチスケール画像の解析に関しては、 画像の構造に対して敏感なものと、そうでないものの 2つの種類の技術が用いられてきた。 後者の手法の典型的な例では、 それぞれのサイズにおける構造を保持する”ぼけカーネル”(blurring kernels) を用いて画像を生成する。 そこでは、ぼけに用いられるカーネルは予め定義され、画像の内容に依存しない。 Koenderink はぼけカーネルにガウシアン分布を用いた場合、 画像解析のプロセスは線形熱(拡散)方程式の発展形と等価である事を示した。 そこで彼はコンボルーションの過程を示す積分方程式を 偏微分方程式を解く形に変形した。 一方、構造に敏感なマルチスケール技術は 1つの画像を異なるスケールで解析する事を試みたものである。 Klinger は構造に過敏なマルチスケール画像表現の1つである4分木の手法を提案し た。 この手法においては、副領域中の画像の分散に基づいて 回帰的に画像を分割していくことで木構造を得ている。 最終的に得られる木構造ではそれぞれの葉が 相当する解像度での分散が小さい画像の領域を示す。 近年になって、Koenderink によって導入された偏微分方程式としての定式化が 構造に敏感なマルチスケール解析を可能にするよう拡張された。 Perona と Malikは、細かい構造が無視される線形熱方程式による 単一のぼけ関数を用いる代わりに、 画像における濃度勾配に基づいた空間的に変化のあるコンダクタンス係数を用いて、 非線形偏微分方程式を導いた。 この場合、4分木の様に末端の結果はあらゆるスケールにおける情報を保持する 単一の画像表現となる。 Perona と Malik のアプローチは注目すべき結果をもたらした。 しかしながら、非線形偏微分方程式の統合は計算量が多い上に、 直列プロセスである為、並列化も出来ない。 本論文においては、 コンボルーションの非線形アナログである積分方程式の解法を通じて、 短時間で処理可能な偏微分方程式の適切な解法を示す。 積分方程式のカーネル関数は Green関数が線形偏微分方程式で用いられていたのと 同様の役割をこなし、 異なるスケール間での整合をとる必要を無くす事で 非線形偏微分方程式を適切な時間で直接的に解くことを可能にしている。 ここでは入力された初期画像に対して、カーネル関数を最適化する為に 学習手法を用いている。 本手法によって、 他の直列アルゴリズムを並列化する手段を提供するのと同等の 処理速度およびノイズに対する頑強性の向上が見られる結果が得られた。

mNt

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


動径基底関数による画像からのパラメトリック形状復元
Parametric Shape-from-Shading by Radial Basis Functions

Guo-Qing Wei, Member, IEEE, and Gerd Hirzinger, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.4, April 1997

本論文では,物体の奥行き情報のパラメータを得る動径基底関数による, 画像からの形状復元の新しい方法について述べる. この動径基底関数は,その中心,幅,重みを調整して明度値のエラーを最小化する ように変形される. 中心と幅の初期値は,収束を速くして解を安定させるために,階層的に調整される. 滑らかさの制限は利用されるが,結局それは解の不安定さを生じさせずに 外すことができる. 我々のパラメトリック形状復元法の重要な特徴は,複数のセンサー情報を 統合するための統一されたフレームワークを提供することである. 画像上のいづれかの地点での表面の深さと表面の平均量の両方あるいはどちらか の知識を,画像からの形状復元プロセスに簡単に組み込むことができることを示す. さらに,画像からの形状復元において,3D再構成改善に質的知識をも使用できること を示す. 合成画像と実画像によって,我々の方法と既存のいくつかの方法について 比較実験をした. その結果,我々の方法の解がより正確であることが示された.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


実時間応用向け手書き単語認識のための語彙駆動型アプローチ
A Lexicon Driven Approach to Handwritten Word Recognition for Real-Time Applications

Gyeonghwan Kim and Venu Govindaraju

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 4, April 1997

Keywords: handwritten word recognition, segmentation algorithm, variable duration, chain code representation, dynamic programming.

本稿では、実時間応用に適した高速な手書き単語認識方法を提案する。 いわゆる前処理、切り出し、特徴抽出という処理の実現にあたり、単語輪郭 のチェインコード表現が用いられている。 入力単語のセグメントと語彙エントリーの文字とのマッチングは動的であり、 これによって語彙エントリーのランク付けがなされる。 可変区間(variable duration)というものが定義され、そこで 用いられる。  実験結果により、可変区間を用いたアプローチ の方が、固定区間を用いたものよりも、 認識精度および測度の両面において優れていることが示される。 全認識プロセスの処理速度は、SPARC-10上でおよそ200ミリ秒である。 また、認識精度は語彙サイズを10としたときに96.8%であった。対象は 212dpiで入力された住所データベースである。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


確率場の特徴の帰納的推論
Inducing Features of Random Fields

Stephen Della Pietra, Vincent Della Pietra, and John Lafferty, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.4, April 1997

Keywords: Random field, Kullback-Leibler divergence, iterative scaling, maximum entropy, EM algorithm, statistical learning, clustering, word morphology, natural language processing.

学習サンプルから確率場を構成する方法について述べる。 学習パラダイムは、次第に増大するサブグラフによって支えられる ポテンシャル関数や特徴を許容することで次第に複雑化する場を構築する。 それぞれの特徴はそのモデルと学習データの経験的な分布の間の Kullback-Leiblerダイヴァージェンスを最小化するように学習される重みを持つ。 強力なアルゴリズムは特徴がどのようにその場に加えられていくかを決定し、 反復してこのアルゴリズムを適用することで重みの最適値を推定した。 本論文で紹介する確率場モデルと手法は コンピュータビジョンの文献で広く用いられているものとは異なる。 それらの論文で述べられている確率場は非マルコフであり、 評価しなければならないたくさんのパラメータがある。 決定木を含む他の学習法との関連についても述べる。 この方法を実証するために、自然言語処理における自動単語分類の問題 への適用について述べる。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


極小面にもとづく物体の切り出し
Minimal Surfaces Based Object Segmentation

Vincent Caselles, Ron Kimmel, Guillermo Sapiro, Member, IEEE, and Catalina Sbert

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.4, April 1997

Keywords: 3D segmentation, minimal surfaces, deformable models, mean curvature motion, medical images.

3次元物体の切り出しと表現に対する幾何学的なアプローチを与える。 切り出しは、3次元画像内で検出されるべき物体へ向かって動く変形可能な面 として得られる。 このモデルは曲率の動きと極小の面積を持つ面、つまり極小面の算出とに もとづく。面が求まる空間は、物体が検出されるべき3次元画像(ボリューム データ)から出てくる。 また、エネルギー最小化を通じて得られる古典的な変形面と、曲率ベースの フローから導かれる固有面との間を結び付けるモデルでもある。 この新しいアプローチは安定でロバストであり、変形の間に生じる面の位相 変化を自動的に処理する。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Hydrographicマップにおける数字の認識: 二値画像解析と地形的特徴抽出
Recognition of Digits in Hydrographic Maps: Binary Versus Topographic Analysis

Oivind Due Trier, Member, IEEE, Torfinn Taxt, Member, IEEE, and Anil K. Jain, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 4, April 1997

Keywords: Binary analysis, topographic analysis, deconvolution, locally adaptive binarization, symbol recognition, data capture.

本論文では hydrographic マップにおける数字の認識について 地形的特徴解析と二値画像解析の性能を比較する. それらの手法のパフォーマンスは, 3,5000文字の数字の0.45 - 0.6 平方メートルの 完全 hydrographic マップ処理を行う際の, 最終記号認識段階の正確な分類率で評価される. 実験の結果、地形的特徴解析に比べ、二値画像解析 の方が良好な性能であることがわかった. 全体的に,二値画像解析の性能は許容可能なものである.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


局所的な正確さの推定を用いた複数の分類方法の組合わせ
Combination of Multiple Classifiers Using Local Accuracy Estimates

Kevin Woods, W. Philip Kegelmeyer Jr., Member, IEEE, and Kevin Bowyer, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.4, April 1997

Keywords: Combination of classifiers, dynamic classifier selection, local classifier accuracy, classifier fusion, ROC analysis.

本論文は、未知のテストサンプルを取り巻く小さな特徴空間における各々の分 類方法の局所的な正確さの推定を使用して分類方法を組合わせる手法を述べる。 5つの実際のデータセットを使用しての経験的な評価によりいくつかの他の方 法と比較して本手法の正当性が確かめられた。また、各々の分類方法の最適な 組合わせを決定する手法も提案する。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


モデルに基づく遠赤外線画像の画像強調
Model-Based Image Enhancement of Far Infrared Images

Ralph Highnam and Michael Brady

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.4, April 1997.

Keywords: Image enhancement, far infrared imagery, homomorphic filtering,spatiotemporal filtering, Prometheus.

区分的に一定値であるような、理想化された遠赤外線画像のモデルをもとにした、 遠赤外線画像の強調アルゴリズムを開発する。 そして、2つの良く知られた強調アルゴリズムである、 メディアン・フィルタと空間準同形フィルタを適用し、 時空間準同形フィルタを開発するためにモデルを拡張する。 アルゴリズムをいくつかの画像系列に適用した結果、 多大な画像強調効果が示された。

HN

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.5


断層撮影の再構築のための非対称物体のランダムで雑音のある投影の 観察パラメータの推定
Estimating the Viewing Parameters of Random, Noisy Projections of Asymmetric Objects for Tomographic Reconstruction

Peter D. Lauren and N. Nandhakumar, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

物体の投影から観察パラメータを決める能力は断層撮影技術の確立を可能にした。 この断層撮影技術は物体の向きを制御できないような状態で得られた画像を3次元的 に 再構築するとき用いられる。 非対称物体の手あたり次第に得られた投影の観察パラメータを決める方法 が説明される。 この方法は共通線(common lines)アルゴリズムを拡張して、投影の相対向きを 3次元フーリエ空間中の投影のフーリエ変換での交差線の場所の情報を 用いて決定する。 並進運動の変位が存在している状態での交差線の新しい発見技法、そして 結果的には、並進運動の変位の大きさを見つける手法を提示する。 このアルゴリズムは完全に記述され、その有効性は実データを用いて 示される。 ノイズを対処する新しい技法も論じられている。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一般化されたアフィン不変な画像正規化
Generalized Affine Invariant Image Normalization

Dinggang Shen and Horace H. S. Ip

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: Image normalization, image orientation, invariant image matching, symmetry detection, fold detection, complex moment, rotationally symmetric image.

本稿では、一般化された画像の正規化技法について述べる。 この方法は、基本的に画像正規化におけるすべての問題点を解決した といえる。 GC(generalized complex)モーメントに関して、非ゼロとなるものが せいぜい3つあれば、いかなる画像の方向であれ一意に定義しうる。 これまでに報告されてきた既存技法では失敗するような劣化画像の いくつかに、この方法を適用することで、その正確さは理論的にも 実践的にも示される。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


流域変形(Watershed Transformation)を用いた並列画像成分ラベリング手法
Parallel Image Component Labeling With Watershed Transformation

Alina N. Moga and Moncef Gabbouj, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: Watersheds, connected components, image segmentation, parallel computing, efficient algorithms.

多値画像の分割において用いられる 並列流域変形(parallel watershed transformation)について、 ラベリングの問題に基づいて再考する。 主となるアイデアは流域変形の直列性を無くし、 それぞれのプロセッサで繰り返し処理を行なうことで、 局所的に連結している全ての構成要素の範囲を正確に定めることである。 領域分割によって生じる、集水域内部が小さな副構成要素に細分化される 問題については、後に大局的な連結成分オペレータによって解決される。 したがって、主-副プロセッサのピラミッド構造によって、 同じ構成要素に含まれる隣接した副構成要素による内部の輪郭は 階層的に削除される。 最終的な連結領域は論理的に格子に配置されたN個のプロセッサを用いて log2 N ステップの計算量で効率的に得ることが出来る。 本アルゴリズムを用いた時間調整と分割の結果は Message Passing Interface 上に構築され、 T3Dクレイモデルに対するテストはこれまでのインプリメンテーションと比較して、 新しいデザインによる解法が優れていることを示した。

mNt

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


トランジトリーイメージシーケンス,漸近的性質,動きと構造の推定
Transitory Image Sequences, Asymptotic Properties, and Estimation of Motion and Structure

John (Juyang) Weng, Member, IEEE, Yuntao Cui, and Narendra Ahuja, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

トランジトリーイメージシーケンスにおいては,シーン要素が 全シーケンスで見え続けるということがない. 単一視線によってカバーし得ないシーンをカメラによって撮影する場合,その イメージシーケンスはトランジトリーである. 本論文では,トランジトリーイメージシーケンスから構造と動きを推定する タスクに関する理論とアルゴリズムについて述べる. トランジトリーなシーケンスを扱う場合には,そうでない場合と大きな 違いがある. また,撮影対象世界を中心とした座標系(WC)とカメラを中心とした座標系(CC)では, トランジトリーなシーケンスにおいて大きな違いがでる. 漸近誤差レートは,推定の際に上記の2つの座標系のどちらを必要としている かに依存してくる. この誤差レートについて言えば,理論的な誤差下限, つまりCram'r-Raoの誤差下限が到達可能な最も低い誤差レート であることが示されている. この結果に基づき,我々は効果的な”クロスフレーム”推定方法を カメラ中心推定に導入した. 対象世界中心座標系には,我々の解析結果によれば,フレーム間動きよりも カメラのグローバルなポーズに基づいた方法の方がよい. 合成画像でのテストに加えて,完全にキャリブレートされたカメラシステムに よって撮られた実画像でも実験を行なった. トランジトリーイメージシーケンスから精度よく推定が行なわれることが示された.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一般化されたマルチセンサー隠れマルコフ連鎖の推定と教師なし画像領域分割
Estimation of Generalized Multisensor Hidden Markov Chains and Unsupervised Image Segmentation

Nathalie Giordana and Wojciech Pieczynski

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: multisensor data, mixture estimation, generalized mixture estimation, hidden Markov chain, Bayesian segmentation, unsupervised segmentation.

本稿では、マルチセンサー融合の一般化された推定問題について挑戦する。 分布融合は、以下のときに一般化されたといわれる。すなわち、 構成要素の正確な性質は未知であるが、その各々が有限で既知の分布族 に属する場合である。 そのような混合の推定には、補足的困難さを要する。 すなわち、 各クラスと各センサーについて、対応する分布の正確な性質がラベル付け されねばならない。 これまでのところ、 そのような一般化混合は、構成要素がPearson系にあるという仮定の もとに研究されてきた。 古典的アルゴリズム、すなわち、期待値最大化や、確率過程的期待値最大化、 あるいは反復的条件推定などの方法の適応は、 そのような独立同一分布データという意味あいにおける融合と隠れマルコフランダム 場 とを推定するのに用いられてきた。 ここでは、より一般的な手続きを提案する。それは、一般化された マルチセンサー隠れマルコフ連鎖の推定への応用が可能である。 提案方法は、教師なし画像領域分割という問題に適用される。 この方法により、以下のことが可能となる。 (1)各クラスと各センサーの条件付き分布の同定 (2)この分布における未知パラメータの推定 (3)より優先的クラス画像の推定 (4)真のクラス画像の推定

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


決定木の枝刈り方法の比較解析
A Comparative Analysis of Methods for Pruning Decision Trees

Floriana Esposito, Member, IEEE Donato Malerba, Member, IEEE Giovanni Semeraro, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: Decision trees, top-down induction of decision trees, simplification of decision trees, pruning and grafting operators, optimal pruning, comparative studies.

本論文ではデータで帰納された決定木を過去に溯って、トップダウンな手法で 枝刈りする問題について述べる。 この問題はパターン認識や機械学習の分野でかなり注目されており、 様々な方法が文献で提案されてきた。 6つの良く知られた枝刈りの方法を、 理論的な基礎、計算の複雑さ及び定式化の強さと弱さ を理解するという目的で比較した。 それぞれの方法の特性に対する論評を経験に基づいて行う。 特に、単純化された木の予備的な正確さに関する様々な実験を いくつかのデータセットに対して行ったところ、その結果は 文献に書かれた結果と反対になることもあった。 この結果の相違は実験の設計の相違のためだと思われる。 最後に、それぞれの方法で観察された刈り過ぎ/刈らな過ぎの傾向の 客観的な評価を得るために、 エラーを減少させた枝刈り方法の特性を証明し利用する。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Espositoらの論文に関するコメント
Comments on Esposito et al.

Jim Kay

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

このノートは、分類手法の性能を比較するためにEspositoら[1]によって 用いられた推論の進め方について論ずる。そして、方法論の再評価に関する 最近の研究との関連をいくつか示した上で、代わりとなるいくつかの アプローチについて述べる。 編者注:レビューの過程で、本論文で用いられている方法論に関して多くの 興味深い問題と、それらが解釈の妥当性に与える影響が指摘された。そこで Glascow大学のJim Kay博士を招き、この問題について専門家としての意見を いただいた。本論文の主要部分に続いて博士のコメントを掲載する。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Borrowed Strength密度の推定によるランダムフィールドの分割
Segmentation of Random Fields Via Borrowed Strength Density Estimation

Carey E. Priebe, David J. Marchette, and George W. Rogers

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: Mixture model, profile likelihood, image analysis, digital mammography.

空間的観測結果を均質な領域に分けることは 幅広い応用分野において求められており, その総数,位置,領域の形状は事前にはわからない. このような手続きにおいて さまざまな領域の観測結果に対する確率分布情報は有用である. しかしこれらの分布は未知であることが少なくない. さらに, 全体的には多くの観測値がある一方で、各々の領域からわずかな観察結果 しか得られないような、対象となる予想領域は小さいだろう. 本論文はこれらの問題への対処法を示す. 最初の低レベル分割手続きによって領域が分割される. 簡便な分割手続きは,この分割された部分領域の クラスタリングとして得られる. 部分領域のクラスタリングは 分割を決定する周辺確率密度関数の推定 から得られた類似行列に依存する. 部分領域に対する密度関数の潜在的類似が調べられた borrowed strength密度を推定することにより, この分割が改善されることを示す. borrowed strength法を提案し, 統計的画像分析からの例により これらの推定による分割のパフォーマンスについて調べた.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


PERFORM: 射影誤差領域の交差を用いた高速な物体認識方法
PERFORM: A Fast Object Recognition Method Using Intersection of Projection Error Regions

Bharath R. Modayur and Linda G. Shapiro

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: Object recognition, bounded error, uncertainty regions, parallel processing, algorithm complexity.

本論文は境界エラーノイズモデルにおける物体認識の問題の新しい公式とこの 公式を使用してモデルと画像特徴間の対応づけを行なうことで一対の組を見つ ける"PERFORM"と呼ぶ物体認識方法について述べる。

PERFORMは画像空間で誤り領域の交差によって対応を評価する。そのアルゴリ ズムは実際の実行時間と同じくらいの理論的な複雑さに関して分析する。マッ チング問題の1つの解が見つかった時、点特徴を使った2次元と2次元の連続 マッチングのアルゴリズムの時間的な複雑さはO(I3 N2)のオーダーである。こ こで、Nはモデルの特徴の数、Iはイメージの特徴の数である。ライン特徴を使っ た時には連続的な複雑さはO(I2 N2)のオーダーになる。

単一の解が見つけられた時、PERFORMは境界エラーマッチング問題を解決する 最も速い方法として知られたものより速く実行できる。PERFORMの手法は重要 な要求として並列処理可能なように開発されたが、それはSIMDのアーキテクチャー でもMIMDのアーキテクチャーでも簡単に実現できることが示される。 PERFORMの並列処理バージョンはスケーラブルであり、MasParとKSRの両方のマ シーンの上で線形的に速度向上がはかれる。

並列処理にインプリメントされた時でも、PERFORMは多くのプロセッサーやメ モリーを必要とせず、最低限の内部プロセッサーコミュニケーションも必要と せず、負荷調整も必要とせず、マッチング問題のすべてあるいは唯一の解決方 法を実行できる。 本論文で記述されたPERFORMのコミュニケーション効果バージョンでは、モデ ルと画像の特徴を保存する必要があるために最低限のメモリが必要であるが、 他のものは実行中に計算される。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


運動からの構造復元における形状の曖昧さ
Shape Ambiguities in Structure From Motion

Richard Szeliski and Sing Bing Kang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997.

Keywords: Structure from motion, ambiguities, bas-relief ambiguity, uncertainty analysis, eigenvalue analysis.

本論文では、運動からの構造復元に固有な、 本質的な曖昧さと不確実性について調べる。 ヘッセ行列の0、または、小さい固有値に対応する固有ベクトルを調べることによ って、 これらの曖昧さの性質を定量化し、再構築された形状の精度への影響を 予知することができる。 平行投影カメラに対する結果は、 回転量が大きくなければ、多くの画像に対してでさえ、 "bas-relief ambiguity" がかなり大きいことを示している。 中心投影カメラに対する同様な結果では、高精度の再構築のためには、 3枚以上のフレームと大きな回転が必要なことが示される。

HN

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像系列のスペキュラ運動を用いた3D表面の推定とモデルの再構築
3D Surface Estimation and Model Construction From Specular Motion in Image Sequences

Jiang Yu Zheng, Yoshihiro Fukagawa, and Norihiro Abe

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

本論文はスペキュラ表面のある物体について、その物体の回転を用いて3D グラフィックモデルの再構築を述べる。 平滑表面上のハイライトと運動を測定するため、連続した画像が撮られた。 共面拡張した光は光線の平面を決め、物体へのハイライトの縞を生成する。 そして、3D表面がこの移動縞から復元される。 我々はEpipolar平面の画像中のハイライトの大局的な運動特性を調査して、 表面のタイプの定性的に同定し、モデリング過程を制御する。 単一と多重の光線平面のイルミネーションについて、画像中のハイライトの向き とEpipolar平面画像中のハイライトの運動を用いた表面と通常画像の復元の 2つの定量的なアプローチが提示された。 これらの計算には、それぞれ1階微分方程式と線形方程式を用いた。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


関数集中による等級別非凸性
Graduated Nonconvexity by Functional Focusing

Mads Nielsen

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: Graduated nonconvexity, functional minimization, mean field annealing, Bayesian reconstruction.

ノイズのある平面の再構成は、(一般的に非凸である)関数の最小化問題 と して述べられることがある。 2次の項を持つ関数に対し、 この論文では、そ のような関数が凸となる基準を述べるとともに、 その最小化のための多様な アプローチについて述べる。 ここでは、2つの近似方法を提案したい。それ は、自動的かつ一般的な近似方法 であって、用いられるのはガウシアンの畳 み込みに基づく凸関数である。 それらは、二つの方法と比較される。 一つは、 Blake-Zisserman のGNC法(graduated nonconvexity)であり、 いま一つは、 Bilbroら、およびGeiger and Girosi の弱い膜の平均場 アニーリングに基づ く方法である。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


最小値,最大値フィルターの為の Gil-Werman アルゴリズムの改良
Improving Gil-Werman Algorithm for Running Min and Max Filters

David Z. Gevorkian, Jaakko T. Astola, and Samvel M. Atourian

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: Running min and max, morphological filters, algorithms, computational complexity.

p個の要素からなる移動データ枠中の 最大値あるいは最小値を算出するのに必要な比較演算の回数の最小値は、 現在の所、出力されるサンプル1つに対しておよそ3回である。 この最小値はそれぞれのアルゴリズムにとって確率的なものであり、 独立して理想的に(i.i.d.)に分散した入力信号が入力された場合の 計算量の平均として導かれるものである。 最悪の場合には、これらのアルゴリズムの計算量は O(p) となる。 Gil-Werman のアルゴリズムによって、最悪の場合の計算量は C1 = 3 - 4/p まで 減らすことが出来る。 そこで我々は 最悪の場合の計算量を変えずに平均計算量を減らすように Gil-Werman の アルゴリズムを改良した。 理論的な解析において、提案手法は i.i.d 信号に対する1次元、2次元の 最大値/最小値移動フィルターの計算量は平均で それぞれ C1 = 2.5 - 3.5/p + 1/p2 と C2 = 5 - 7/p + 2/p2 に減少する。 そしてシミュレーションによって得られた結果は、理論を裏付けるものであった。 さらに 実験によって要素間に高い相関のある実画像に対して、 本アルゴリズムは i.i.d 信号が入力された場合と同等の性能が得られることが 検証された。

mNt

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


イメージ検索のための局所的グレイ値不変量
Local Grayvalue Invariants for Image Retrieval

Cordelia Schmid and Roger Mohr

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

本論文では,巨大なイメージデータベースから画像を検索する問題に ついて述べる. 自動検出された特徴点における局所的グレイ値不変量に基づく 方法を提案する. 投票アルゴリズムと半局所的制約によって検索が可能となる. インデクシングによって,1000画像以上のデータベースからの効率的 な検索が可能となる. 部分的な可視性,類似変形,外部からの特徴,そして小さな遠近法変形の 場合において実験では正しく検索できた.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


摂動法によるオフライン手書き数字認識
Off-Line, Handwritten Numeral Recognition by Perturbation Method

Thien M. Ha and Horst Bunke

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: writing habits and styles, writing instruments, reversing process, perturbation method, decision combination, k-nearest neighbor rule, neural networks.

本稿では、オフライン手書き数字認識のための新しいアプローチを提案する。 ここで提案される認識方法は、書き癖および筆記具に起因する摂動という概念に 基づいており、変わった書き方による様々な歪みに説明を付けることができる。 この方法を、CEDARとNIST(これらは、切り出し済み数字を対象とした2つの 世界的標準データベースである)に対して試行し、拒否なしの場合でそれぞれ 正読率99.09%および99.54%という結果を得た。 後者の結果は、17万文字以上についてテストされている。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


テクスチャ特徴に基づいた文書画像の2値化
Document Image Binarization Based on Texture Features

Ying Liu and Sargur N. Srihari

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 5, May 1997

Keywords: Index Terms-Image processing, document images, thresholding, texture analysis.

以下のような文書画像を2値化することは、困難であった。 すなわち、コントラストがはっきりしない、ノイズが多い、パターンが 複雑である、および/あるいはグレースケールのヒストグラムが様々な 形状をしているといった文書画像である。 この問題を解決するためにテクスチャー特徴に基づいた 2値化のアルゴリズムを開発した。 我々のアルゴリズムは3つのステップからなる。 1) Otsuのアルゴリズムを反復的に用いて閾値の候補を得る 2) それぞれの閾値候補におけるテクスチャー特徴を、その閾値で2値化された 画像のランレングスヒストグラムから抽出する 3) 最適な閾値は望ましい文書のテクスチャ特徴が保持されるように選択する 米国の郵便物から任意の9,000の印字された住所領域の画像について実験したところ 、 新しい2値化の方法で99.6%を越える成功率を得た。 これは既存の方法に比べてかなり良い結果である。 また、低品質な郵便物の宛名ブロック500画像に対して本手法で2値化 した場合、Otsuのアルゴリズムに比べて8.1%高い文字認識率が得られた。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.6


画像のλτ空間表現と一般化エッジ検出
Lambda-tau Space Representation of Images and Generalized Edge Detector

Muhittin Gokmen and Anil K. Jain, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

Keywords: Edge detection, surface reconstruction, image representation, scale space, regularization.

正則化理論にもとづく画像と面の表現を、本論文で導入する。この表現は 物理の膜モデルと板モデルから導かれた混合モデルがもとになっている。 lt表現と呼ばれるその表現は、2つの次元を持つ。1つは滑らかさ、すなわち スケールを表す次元で、もう1つは画像や面の連続性を表す次元である。 そこにはスケール空間と、連続関数の重み付きSobolev空間の両方でサンプリング された画像/面が含まれる。したがって、この新しい表現は、よく知られた スケール空間表現の拡張とみなすことができる。 提案された混合モデルによれば、両極端な2つのモデル、すなわち膜モデルと 板モデルに比べて、結果が改善されることを実験的に示した。 この混合モデルをもとにして、一般的な枠組みにおける周知のエッジ検出の ほとんどを包含する、一般化エッジ検出(GED)を開発した。 GEDには2つのパラメータがあり、1つはフィルタの形を制御し(τ)、 もう1つはフィルタのスケールを制御する(λ)。従来のエッジ検出は、 GEDの2つのパラメータを単純な値にすることによって得られる。 これら2つのパラメータの値を連続的に動かすことで、空間内のエッジ表現 を生成することができる。これは特定用途向けの目的指向のエッジ検出手法を 開発するのに非常に有用である。 輝度画像、距離画像、ステレオ画像のような、いくつかの異なった種類の画像 データについて、提案した表現とエッジ検出を質的量的に評価した。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ローカルサーチを用いた2次元線モデルのマッチングはどの程度容易か?
How Easy is Matching 2D Line Models Using Local Search?

J. Ross Beveridge and Edward M. Riseman

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

Keywords: Object recognition, optimal model matching, line segment models, run-time performance, characterization, random-starts local search.

ローカルサーチは十分に確立された手法であり,複雑な組合わせ 最適化問題の解決手法として大変効率的である. ここでは、難しい幾何学的マッチング問題を解くのに、ローカル サーチが適用される. マッチングは、線セグメントのモデルと画像上の線セグメントとの 間で最適な多対多対応のマッピングを見つける問題として、位置づ けられる. イメージデータに関して以下ことを仮定する。すなわち、それは ばらばらであり、ノイズを含んでおり、入り乱れているというもの である. 提案アルゴリズムの応用分野は、ロボットナビゲーション,写真解釈, シーン理解などであった. 本論文ではモデルの複雑さ増加,イメージの乱雑さ増加, イメージへのモデル付加に対するローカルサーチの性能を示す. 95%の信頼性をもつ最適マッチを見つけるための予想実行時間が、 6つのモデルを含む48の個別の問題に対して決定される. 実行時間の増加を問題サイズの関数として評価するのに、 非線型回帰が用いられる. 実行時データに対し、多項式増加モデルおよび指数的増加モデル の両方が当てはめられる. ランダムな乱雑さを持つ問題に対しては, 多項式モデルのあてはめがよく,増加はツリーサーチに相当する. ツリーサーチが指数的である対称的モデルおよび 複数モデルインスタンスに関する問題に対しては, 多項式的増大モデルのほうがあるサーチアルゴリズム に対する指数関数的増大モデルよりも優れており,他のものに匹敵する.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers,Inc. All rights reserved.


Eight-Pointアルゴリズムの擁護
In Defense of the Eight-Point Algorithm

Richard I. Hartley

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

Keywords: Fundamental matrix, eight-point, algorithm, condition number, epipolar structure, stereo vision

基本行列は較正されていない2つのカメラで取られたシーンを解析 する基本的なツールであり、eight-pointアルゴリズムは8点かそれ以上のマッ チング点から基本行列を計算するためにしばしば用いられる方法である。それ は簡単にインプリメンテーションできるという利点がある。 しかしながら、よくある見方は以下のようである。すなわち、それは極端にノ イズに影響されやすい方法であり、そのためにほとんどの目的に対して事実上 は役に立たないというものである。

本論文では、マッチングする点の座標の非常に簡単な正規化(移動と変倍)を 最初に施すことで最も優れた繰り返しアルゴリズムに匹敵する結果を得るとい うことに挑戦する。この向上した性能は理論により正当化され、実際の画像に 対する実験で確認される。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


物理をもとにした Early Vision のための適応的な前処理
Physically Based Adaptive Preconditioning for Early Vision

Shang-Hong Lai and Baba C. Vemuri, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

Keywords: Early vision, computational vision, adaptive preconditioning, wavelet transform, regularization, surface reconstruction, shape from shading, optic flow computation.

これまで、early visionにおける諸問題は、正則化の枠組の中で定式化されたきた 。これらの問題は、離散化したときに、疎な大規模線形方程式系になってしまう 。本論文では、このような線形方程式系を解くときの収束速度を大幅に改善するた めの共役勾配アルゴリズムと一緒に用いることができるような、新しい物理をもと にした適応的な前処理方法を提示する。明らかに、membrane spline, thin plate spline, または、その二つの凸結合をもとにした前処理は、物理をもとにした前処 理と呼べる。データとともに正則化フィルタのスペクトル特性を用いることによって 、 前処理をearly visionの問題に適応させることができる。このスペクトル関数を選 択したウェーブレット基底の周波数特性を調整するのに用い、そして、これらの調 整された値を前処理の構築に用いる。曲面再構築、陰影からの形状復元、そして 、オプティカル・フローの計算の3つの 異なるearly visionの問題に対して、前処理の構築を示す。人工データと実際のデ ータを使った実験を通して、前処理方法の性能を示す。コンピュータ・ヴィジョン の文献に述べられている、 これらのearly visionの問題に対する他の前処理の方法にくらべて、我々の前処理 の方が優れた性能を示している。

HN

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


最適クラス選択的拒否ルール
The Optimum Class-Selective Rejection Rule

Thien M. Ha

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

クラスを選択的に除去する方法は、単に1つ1つの事象を除去する 手法を拡張したものにすぎない。 すなわち、N-クラス問題において、ある入力パターンがそのN個のクラス中の一つに 確信をもって割り当てられないとき、簡単に拒否されることの代わりに、そのパター ン のもっともらしいクラスの部分集合に割り当てるのである。 より多くのクラスを選択することは、エラーのリスクを軽減できるが、そのために、 多数の残留クラスを抱えることになる。 ここで、クラス選択的拒否の最適性は、エラー率と選択されたクラスの平均数の 間の最適なトレードオフとして定義される。 形式的に言えば、トレードオフ研究は意志決定理論の枠組みで行われることである。 平均期待損失はエラー率とクラスの平均数の線形結合として表現される。 そして、この平均期待損失の最小化は最適トレードオフをもたらす。 離散的凸最小化によって、この最適化ルールの複雑さはクラス数に線形的であるレベ ル まで軽減した。 エラー率とクラスの平均数の上界が導出された。 この最適意志決定ルールの様々な側面を示す例を提示した。 最後に、この新しい意志決定ルールの実施について論議した。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


パターン識別のための K1 マップ簡略化
The K1-Map Reduction for Pattern Classifications

Tsong-Chih Hsu and Sheng-De Wang, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

Keywords: Karnaugh map (K map), pattern classifications, RCE, RBF, One-Class-One-Network.

手動による手っ取り早い簡略法としてカルノー図(K map)が知られているが、 これはハードウェア要求を最小化する目的で二値関数を最も簡略化 するのに、効率の良い方法である。 本論文では、パターン識別問題に、カルノー図の主要グループと必須主要 グループという概念を適用することで、K1図簡略化法を提案する。 K1図簡略化法は、制限付きクーロン・エネルギー(RCE)・ネットワークの 設計とその隠れ層数の決定とを、体系だった方法で行うのに用いられる。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


オンライン続き文字認識における合字(Ligature)のモデリング
Ligature Modeling for Online Cursive Script Recognition

Bong-Kee Sin and Jin H. Kim

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

Keywords: Online character recognition, cursive script, Korean character, ligature, hidden Markov model, network searching.

続き文字については、形状のバリエーションが豊富であることと、 文字の境界が曖昧であることからオンラインで文字認識を行なうことは困難であった 。 本論文で提案する手法は、文字パターンと、続き文字において文字間に生じる 合字(ligature)パターンから構成される隠れマルコフモデルに基づいている。 その際、それぞれの文字と合字について1つの隠れマルコフモデルを作成した。 これは手書き文字における時間的、空間的な変化をモデル化したものである。 そして、2つの種類の隠れマルコフモデルを結び付けることで、 全ての単語あるいは合成文字のネットワークモデルをデザインすることが できた。 このネットワークには文法と構造的制約の知識を取り入れているので、 手書き文字の特徴を良くとらえることが出来る。 ネットワークを用いることで、認識の問題は 開始ノードから終了ノードまでの最適パス探索の問題に帰結する。 本手法では動的計画法を用いて最適パスの探索を行なう。 この手法では文字認識と文字切り出しを同時かつ効率的に行なうことが出来る。 韓国文字の認識実験では筆記制限の無い文字サンプルに対して 93.3%の認識性能を得た。 論文中では他の隠れマルコフモデルを用いた認識手法との比較も行なっている。

mNt

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


離散リラクゼーションによる構造マッチング
Structural Matching by Discrete Relaxation

Richard C. Wilson and Edwin R. Hancock

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

離散リラクゼーションによりリレーショナルグラフマッチングを実行する ためのベイズフレームワークについて述べる. リレーショナルマッチングの多数の対照的アプローチを比較評価することを このフレームワークの上で提供することが我々の基本的な目的である. 概してこの研究には2つの大きな特徴がある. 一つめは,関係の不正確さの定量化をどうするかということである. いくつかのよくある相関距離尺度を, 特定の制限付きベイジアン一貫尺度のケースに落すことができることを示す. 我々の比較方法の2つめの特徴は, 構造の不正確さがコントロールされる方法に関係する. 対照制御モデルを引き出すマッチングプロセスの3つの異なった実現方法に ついて研究した. 結論として, グラフ編集のこのアクティブプロセスが, 多量の入り混じったノイズを効果的に制御するその能力において,代替案をしのぐ と言える.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


階級的手法を用いたグレースケールモーフォロジーテンプレートの分解
Decomposition of Gray-Scale Morphological Templates Using the Rank Method

P. Sussner and G.X. Ritter

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

“たたみこみ”は画像処理における基本的なツールである。 二次元線形のたたみこみの例としては、画像相関、平均値フィルター、離散 フーリエ変換、多様なエッジマスクフィルターなどがあげられる。 非線型のたたみこみの例としては、メディアンフィルター、中心軸変換、数 学的モーフォロジーで定義される収縮(erosion)と膨張(dilation)などが ある。 たたみこみのためのマスク、構成要素が大きくなると、計算のコストのため に実行できない可能性がある。 ところが、マスク、構成要素を小さなテンプレートの組に分解することによ り、このコストを著しく削減できるという例が多数存在する。 and, thus, resulting in optimal transform performance. それに加えて、このような分解は、しばしば構造を明らかにし、最適な変換 性能をもたらす。 我々は本論文において、線形のテンプレートについて用いられている分解方 法に類似した、モーフォロジーテンプレートの分解方法を与える。 具体的には、モーフォロジーテンプレートの階数の概念を定義し、分離可能 なモーフォロジーテンプレートを階級1に分類する。 次に、階級1のテンプレートを3×3のテンプレートに分解できるための必 要十分条件を定める。 そして、階級2のテンプレートに対するテンプレート分解方法を開発するた めにあるいくつかの変換におけるテンプレート階級の不変性を用いる。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


曲線の多角形近似の評価方法
Techniques for Assessing Polygonal Approximations of Curves

Paul L. Rosin

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

Keywords: Polygonal approximation, assessment, optimal breakpoints, dynamic programming.

曲線を多角形近似する方法は非常に多くあり、これらの 異なったアルゴリズムを評価する方法が求められている。 いくつかの標準的な方法は、近似が様々な数の直線を含む場合には不適切 である。 そこで我々はアルゴリズムの結果を最適な多角形に対して比較評価する 方法を提案し、また相対的な忠実さと曲線分割の効果を組み合わせた 尺度について述べる。 我々は23のアルゴリズムをTehとChinによって最初に用いられた曲線に適用し、 この尺度を用いて比較した。彼らのISEは最適なISEとの比較で評価される。 さらに姿勢推定の例を用いて、適切な評価基準を選ぶのに どのように目標指向の評価を用いることができるのかを示す。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ノンパラメトリックな線形識別アルゴリズムの次元数、学習データ数、 おいび識別誤り率について
On Dimensionality, Sample Size, and Classification Error of Nonparametric Linear Classification Algorithms

arunas Raudys

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.6, June 1997

Keywords: Generalization error, dimensionality, complexity, sample size, training, margin.

本論文では、ゼロ学習誤差識別と最大マージン識別という2つの ノンパラメトリックな線形識別アルゴリズムを、多変量ガウス分布を識別 するように設計されたパラメトリックな線形識別と比較する。 そして識別誤り率の期待値の平均 MEP_{N} に対する表式と数表を与える。 そこから、識別誤り率は主に学習セットの大きさと次元数の比 N/p で決まる ことがわかる。 しかし、パラメトリックな線形識別とノンパラメトリックなそれとでは、 未知データの誤り率に対する学習セットの大きさの影響は全く異なる。 ある条件の下では、特徴の数が学習データの数を上回るような場合でも、 ノンパラメトリックなアプローチによって信頼性の高い法則が得られる。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.7


人とコンピュータの対話のための手振りの視覚的な解釈:レビュー
Visual Interpretation of Hand Gestures for Human-Computer Interaction: A Review

Vladimir I. Pavlovic, Student Member, IEEE, Rajeev Sharma, Member, IEEE, and Thomas S. Huang, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

Keywords: Vision-based gesture recognition, gesture analysis, hand tracking, nonrigid motion analysis, human-computer interaction

手振りの使用は、human-computer interaction(HCI)のための煩わしいインター フェースのデバイスに魅力的な選択肢を与える。特に、手振りの視覚的な解釈は HCIに対する楽で自然なものという要望に応える手助けとなる。これはコンピュー タビジョンに基づく解析と手振りの解釈に関する大変活動的な研究の領域を活性化 する。

本論文では手振りの視覚的な解釈に関する文献をHCIにおけるその役割という 観点でサーベイする。この議論はジェスチャーをモデル化し解析し認識するた めに使用される手法に基づいて体系化されている。ジェスチャーの解釈のアプロー チによる重要な差は、人の手の3次元モデルを使用するのか、目に見える画像 のモデルを使用するのかによる。3次元モデルは、手のジェスチャーのより精巧なモ デリン グの方法を提供するが、HCIのリアルタイム性への要求に応えられないという計算量 の障害がある。目に見える画像のモデルを使用するアプローチは 限定された条件の下ではうまく働く計算量としては効率的な目的指向のアプロー チであるが、HCIで要求される一般性には欠けるようである。

また、ビジョンによるジェスチャー認識の他の本質的なアプリケーションと同 様にインプリメントされたシステムも議論する。しかし、ジェスチャーがHCI に広く使われる以前に計算量での利点が必要となるのと同じくらいより理論的な 進歩が現在望まれている。人とコンピュータとの対話の他の自然なモードとの インテグレーションも含め、ジェスチャー認識の将来の研究の方向を議論する。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


物体表現のための確率的な視覚学習
Probabilistic Visual Learning for Object Representation

Baback Moghaddam, Student Member, IEEE, and Alex Pentland, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

Keywords: Face recognition, gesture recognition, target detection, subspace methods, maximum-likelihood, density estimation, principal component analysis, Eigenfaces.

固有空間分解を使った多次元空間における密度推定をもとにした、教師なしの視覚 学習の方法を提示する。トレーニング・データをモデル化するために、多変量ガウ シアン(単峰性分布に対して)と混合ガウシアンモデル(多峰性分布に対して)の 2種類の密度推定量を導く。そして、自動物体認識と符号化のための視覚的探索と 目標検出の最尤推定の枠組を定式化するのに、これらの確率分布を用いる。我々の 学習方法を、確率的な視覚モデリング・検出・認識、そして、人間の顔や非剛体的 な物体(手など)の符号化に応用する。

HN

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


固有顔対フィッシャー顔:クラス特有の線形投影を用いる認識
Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection

Peter N. Belhumeur, P. Hespanha, and David J. Kriegman

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

本論文は照明方向と面部表情の多様化に敏感でない顔認識アルゴリズム の開発について論ずる。 我々はパターン分類アプローチにおいて、画像中の各ピクセルを ある高次元空間中の一つの座標として考える。 我々は次の観察事実を利用した。 すなわち、姿勢は固定だが照明は変化するという条件のもとで 特定の顔から得られた画像は、その顔が陰のない Lambertian 表 面であるならば高次画像空間の3D線形部分空間に存在する、と いうことである。 しかし、顔面は真のLambertian表面ではないため、自分自身の影が確実に生じ、 画像はこの線形部分空間から外れる。 この逸脱を正確にモデル化する代わりに、顔面の外れの大きい 領域を少なくするように画像をある部分空間に投影する。 この投影法は Fisher の線形判別式に基づくものであり、照明と面部表情の激しい 変化においても、低次元の部分空間へのよく分離したクラスを生成できる。 固有顔法は、画像空間を低次元部分空間に線形的に投影するもう一つの方法 であり、似たような計算条件を要求する。 ハーバードとエール顔面データベースを使った大規模な実験の結果は 提案された Fisher顔法のエラー率は 固有顔法のエラー率より低いこ とを示した。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


顔認識:照明方向における変化の補償問題
Face Recognition: The Problem of Compensating for Changes in Illumination Direction

Yael Adini, Yael Moses, and Shimon Ullman

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

KEWORDS: Face recognition, compensating for illumination, edge representation, 2D Gabor-like filter, image comparison.

顔認識システムは、新しい画像から顔を認識しなければならない。 それは、同一の顔から得られる異なる画像間に多様さがあるにも かかわらず、である。 反射方向の変化による画像の多様さに対処する共通のアプローチは、 このような多様さに対し、相対的に鈍感な画像表現を用いるという ものである。 そのような表現の例として、エッジマップ、画像輝度の導関数、および 2Dガボア風フィルタの畳み込み画像がある。 ここでは、これらの表現が、表情という観点のみならず、反射の変化に 対してどれほど敏感かを評価するという経験的な研究について報告する。 我々の発見したところでは、いかなる表現であっても、反射方向の変化 による画像の多様さに対処するうえで、その表現のみで十分ということは ない、ということである。 同様な結果が、表情という観点での変化に対しても、得られた。 水平特徴を強調する画像表現が、反射方向の変化に対して、より鈍感で あることがわかった。 しかしながら、そのような表現のみに基づくシステムでは、我々の持つ データベースに関し、20%までの認識率低下がある。 人間は、同一の条件でかなりよく認識することができた。 人間のこの優越性の理由について、および、認識における反射効果に対処 するための代わりの方法について議論する。

Sz

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


1つの例示画像からの線形物体クラスと画像の合成
Linear Object Classes and Image Synthesis From a Single Example Image

Thomas Vetter and Tomaso Poggio

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

Keywords: Linear object recognition, rotation invariance, deformable templates, image synthesis.

3次元物体を1方向から撮影した画像を用いて、 他方向から撮影した場合の画像を生成する必要性は、 グラフィックスや物体認識を含むさまざまな分野で生じている。 近年、我々は制限のある状況下で適用可能なシンプルな手法を導入した。 提案する手法では関連のある物体クラスにおいて特有である画像の変換を用いる。 また、その変換は同じクラスの他の例示物("prototypical" objects)の 画像から学習することが可能である。 proposed by Poggio and Vetter. 本論文では、このような手法を Poggio と Vetter によって提案された 線形クラス(linear class)の概念を拡張した手法として紹介する。 線形物体クラスにおいては、 線形変換は2次元のプロトタイプ画像の基本セットから正確に学習できる。 我々はこの手法を人工画像に適用した実験を行なった。 その実験を通じて、本手法を用いることで、 1枚の2次元画像から高密度の顔画像を効果的に回転させることが出来る ことを示す証拠を得た。

mNt

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


フレキシブルモデルを使用した顔画像の自動解釈と符号化
Automatic Interpretation and Coding of Face Images Using Flexible Models

Andreas Lanitis, Chris J.Taylor, and Timothy F.Cootes

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

顔画像は変化に富むので自動解釈するのが難しい. 可変性を生むものとして、個々の外観、3Dポーズ、顔の表情、および、照明 がある. which takes into account all these sources of variability. 私たちは、これらの変動の原因を全て考慮する,顔の外観のコンパクトな パラメータ化されたモデルについて説明する. このモデルは形状とグレーレベルの両方を表現するもので, 顔画像のトレーニングセットの統計的分析を実行することによって、作り出さ れる。 強健なマルチリゾリューションサーチアルゴリズムによって、 顔画像へのモデル当てはめがされる. これによって,顔の主要特徴の位置決めと,1セットの形、および、グレー- レベル外観パラメータの決定が可能となる. これらのうち100以下のパラメータの使用で,与えられた顔画像の 良好な近似が行なわれる. この表現方法は,画像符合化,個人識別,3Dポーズ認識,性別認識, 表現認識などに使用可能である. 3Dポーズ,照明,表情の広く変わる条件の下で得た690の顔画像を使って 実験を行なった. システムは、上で述べた全ての課題において良好な結果を示した.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


顔の表情のコード化、解析、解釈、認識
Coding, Analysis, Interpretation, and Recognition of Facial Expressions

Irfan A. Essa and Alex P. Pentland

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

顔の構造についての幾何学的、物理的、動的モデルを組み合わせたオプティカ ルフローを最適化することにより、顔の動きを観察するコンピュータービジョ ンシステムについて述べる。 この方法は顔の動作を性格に評価するだけでなく、顔の筋肉の動きに関して信 頼性のあるパラメーター表現をも与える。 顔の表情の解析における従来の研究は、心理学者が静止画から表情をコード化 できるように開発された表記法である、Facial Action Coding System (FACS) に基いていた。 発見的なコード化技術の使用を避けるために、我々は顔の動作と筋肉の動き確 率的に特徴化するコンピュータービジョンシステムを用い、FACS+ と名付ける、 新しくより正確な人の顔の表情の表記法を得た。 最後に、この方法が顔の表情のコード化、解析、解釈、認識にどのように用い られ得るかを示す。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


拘束条件を用いた識別関数の重みの学習アルゴリズム
An Algorithm for the Learning of Weights in Discrimination Functions Using A Priori Constraints

Norbert Kruger

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

Keywords: Discrimination functions, a priori knowledge, weighting, face recognition, elastic graph matching.

通常「重みつき平均」と言われる識別関数の非常に一般的なクラスに おける重みの学習アルゴリズムを紹介する。 紹介する学習アルゴリズムは、重要な特徴について予め与えられた 単純だが効果的な基準によって、独立な変数を減らすことができる。 我々はこのアルゴリズムを3つの異なった次元の顔認識に関する課題 に適用した。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


平行移動、変形、および背景変化に対してロバストな物体認識
Object Recognition Robust Under Translations, Deformations, and Changes in Background

Rolf P. Wurtz

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

Keywords: Object recognition, face recognition, coarse-to-fine strategy, parallel processing, Gabor function, wavelet transform, image pyramid, correspondence problem, background independence.

低レベルの特徴を用いたモデルマッチングにもとづく認識系は、しばしば 背景の変化による誤りを起こす。 一つの解決策として、髪型によらない顔認識系を与える。 ピラミッド式に適用されるガボアフィルタで、粗から密なレベルへのマッチング を行なって、画像とモデルとの間の対応マップを作り上げ、階層的な認識を 行なっている。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


弾力的 Bunch グラフマッチングによる顔認識
Face Recognition by Elastic Bunch Graph Matching

Laurenz Wiskott, Jean-Marc Fellous, Norbert Kruger, and Christoph von der Malsburg

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

Keywords: Face recognition, different poses, Gabor wavelets, elastic graph matching, bunch graph, ARPA/ARL FERET database, Bochum database.

本論文では顔画像の認識システムを提案する. システムは,一人につき1画像を記憶した大規模データベースをもち, 1枚の登録されていない画像から顔を認識する. 顔は Gabor wavelet 変換に基づいてラベルづけされたグラフにより表現される. 新しい顔の画像グラフは弾力的グラフマッチングプロセスにより抽出され, 単純な類似関数により比較される. 本システムはすでに提案されているもの[1]とは3点が異なる. 正確なノードポジショニングを行うためにフェーズ情報を用いる. 大きな回転を詳細に扱うためObject-adaptedグラフを用いる. 画像グラフ抽出は サンプル画像グラフの小集合から構成される 新しいデータ構造(bunch graph)に基づく.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Pfinder: 人間の身体の実時間追跡
Pfinder: Real-Time Tracking of the Human Body

Christopher Richard Wren, Ali Azarbayejani, Trevor Darrell, and Alex Paul Pentland

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

Keywords: blobs, blob tracking, real-time, person tracking, 3D person tracking, segmentation, gesture recognition, mixture model, MDL

Pfinderは人を追跡するための実時間システムであり、人の行動の解釈を行な う。標準的なSGI社のIndy computerで10Hzで動作し、多くの異る場所で何千も の人を対象にしても正確に動作する。システムは、視覚的な幅広い条件におい て頭と手の2次元表現を得るためにカラーと形状のマルチクラスの統計モデル を使用する。Pfinderはワイアレスのインターフェース、ビデオのデーターベー ス、低バンド幅コーデイングを含め、アプリケーションの広い範囲でうまく動 作する。

M.T.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


生体計測による照合システムにおける誤認識とリジェクトのトレード・オフについて
On the Error-Reject Trade-Off in Biometric Verification Systems

Matteo Golfarelli, Dario Maio, Member, IEEE, and Davide Maltoni

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, No.7, July 1997

Keywords: Biometric verification systems, statistical pattern recognition, Bayes error rate, rejection error rate, hand geometry, human face.

本研究では、生体計測による照合システムの性能評価の問題について考える。照合 システムに対して最適なベイズ決定基準を定式化し、データ分布を多変量正規分布 と仮定することにより、誤り許容率と誤り拒絶率を理論的に計算するための2つの 統計的な表現を導く。一般に、ベイズ的パラメトリックモデルを採用することは 、システムの誤りの計算のための明確な数式を得ることを考慮していない。生体計 測による照合システムに関する限り、何らかの妥当な仮説を採用することができる ので、単純で取り扱いやすい数式を導くことができる。手の形と人間の顔をもとに した、2つの照合システムのプロトタイプを使って、我々の方法の基礎づけが正し いことを示す。

HN

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.8


最適局所重み平均法による輪郭スムージング
Optimal Local Weighted Averaging Methods in Contour Smoothing

Raymond Legault and Ching Y.Suen

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

いくつかのアプリケーションにおいて,2値輪郭はパターンの表現や識別に 用いられるが,ノイズと量子化エラーを削減するためにスムージングが必要 となる. そこでは輪郭点座標の局所重み平均化がよく用いられる.簡単で,効果が 見られるからである. ガウスフィルターの”最適性”を唱えてそこでガウシアンによる重みを使う人は 多いであろう. しかし一般にこれらのフィルターは最適ではなく,局所重み平均化手法それ 自体の理論的進歩はあまりなかった.

本論文では,輪郭点位置,接線方向,誤差角度などの正確な推定を行なうための 最適局所重み平均化手法の直接的な誘導について述べる. シンプルな離散ノイズモデルを新しく提案する.これによって, 異なるウィンドウサイズのための重みのもっとも良いセットを導くことが できる. この最適化された重みによって除かれるノイズの割合の推定も同様に行なわれる. 最後に,様々な半径のデジタル円における等価問題を数値的解くことで, 任意の屈曲における本方式の適応性を示す.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


不連続性と複数の構造による強健な推定におけるバイアス
Bias in Robust Estimation Caused by Discontinuities and Multiple Structures

Charles V. Stewart

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

複数の構造を含むデータにモデルをフィットさせる場合, 例えば,距離不連続を含む近傍から得たデータに表面パッチをフィット させるような場合には,強健な推定方法は真の孤立点と偽の孤立点の 両方を扱えなければならない. 偽の外縁点は,注目構造にとっては孤立点であるが,異なる構造に とっては内部点である. この偽の外縁点は総体的な真の孤立点とは一貫性が違う. このようなデータは,動き推定,モデルフィッテイング,レンジデータ 解析などのコンピュータビジョン問題ではよく現れる. 本論文では,レンジデータの不連続点近傍における表面フィッテイング問題 について述べる. このようなタイプのデータの自乗の最小メヂアン,最小まるめ自乗,M推定, ハフ変換,RANSAC,MINPRANなどの性能を特徴づけるために, ロバストな統計的文献による方法を使って,”偽の孤立点バイアス”メトリック を開発した. そしてそれは,様々なタイプの不連続の分布モデルによるロバストなフィット におけるエラーの学習に利用される. 実験結果は,各ロバスト推定が小さなバイアスにとどまり,しかし 相当な,不連続であることを示す. またこの結果は,異なる推定が最も有効であるである条件を示す. この結果が示す最も重要なことは,現存の推定方法は使用に注意すべきで あり,新しい推定方法が開発されるべきである,ということである.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


キャリブレーションされていないアフィンカメラにおける線対応から得られる アフィン構造
Affine Structure from Line Correspondences with Uncalibrated Affine Cameras

Long Quan and Takeo Kanade

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

本論文では,キャリブレーションされていないカメラによって撮影した画像の 線対応から,3Dアフィン形状と動きを求める線形アルゴリズムに ついて述べる. 本アルゴリズムは,3画像以上における最低7つの線の対応を必要とする. キーとなるのは,1次元射影カメラの導入である. これは,「線方向」の3Dアフィン再構成を「点」の2D射影再構成に 変換する. 加えて,冗長なビューを扱うために,ラインベースの因子分解方法を 提案する. 人工画像と実画像における実験によって,本アルゴリズムの頑健性と 正確性が示された.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Waveletベースのアフィン不変表現: 3D空間における平面オブジェクトの認識のためのツール
Wavelet-Based Affine Invariant Representation: A Tool for Recognizing Planar Objects in 3D Space

Quang Minh Tieng and Wageeh W.Boles

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

一般アフィン変換のもとで,平面オブジェクトの表現を構成するための 方法を示す. 任意の方向のカメラによって観察された, 3D空間における平面またはほぼ平面によるオブジェクトを表現することが できる. 本方法は,アフィン不変なパラメータと,1対のwavelet変換によってパラメータ 規定される,オブジェクト輪郭に基づくものである. wavelet変換は,アフィン不変輪郭表現からの複数解像度アフィン不変特徴を 抽出するものである. 相違点関数は、異なるオブジェクト表現を区別するために利用される. この関数は表現上のextremaを利用して,計算を非常に能率的にする. 異なるwavelet関数とそのオーダーまたは消滅モーメント使用の効果 もまた検討される. 実験により,提案表現が既存の方式よりも性能がよいことが示された. それは特に雑音が重い時ほど効果が見られた.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


イメージストリームからの形状と運動の推定のための連続的な因子分解方法
A Sequential Factorization Method for Recovering Shape and Motion from Image Streams

Toshihiko Morita and Takeo Kanade

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

追跡特徴による,イメージシーケンスから物体の3D形状およびカメラ動き の推定のための,連続因子分解方法について示す. TomasiとKanadeによって元来提案された因子分解方法は、特異値分解を 組み込んだもので、強健で正確なものであった. しかしながら、特異値分解のコストが大きく,バッチタイプの操作に適用する に留まり,実時間アプリケーションへ適用するのがいまだに難しいものである. 特徴ポジションをベクトル時シリーズとみなすことによって, 因子分解法を連続的な方法とした. 新しい方法は、各々のフレームで形状と運動の推定を行なう. 特異値分解は、わずか3つの支配的な固有値ベクトルの更新計算と 置き換えられる. そして,特異値分解がO(FP2)のF-by-Pマトリクス操作を必要とするのに 対して,固有値ベクトルはO(P[2])の時間で求めることができる. また,本方式は増大する大きなマトリクスを蓄えることをしないので, 無限シーケンスをも扱うことができる. 人工的および現実のイメージを使った実験で,オリジナルの方法と ほぼ同じ正確さと強健さが示された.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


多大な種類の工業図面を認識するシステム
A System for Recognizing a Large Class of Engineering Drawings

Yuhong Yu, Ashok Samal, Member, IEEE, and Sharad C. Seth,

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

シンボルと接続ラインのインスタンスを交互に繰り返すことによって 特徴づけられる多大な種類の工業図面を認識するシステムについて 示す. この図面種類は,フローチャート,論理および電気回路,および化学プラント図 などを含むものである. システムの出力である,シンボル種類とその交差を特定したネットリストは, デザインシュミレーションに使うことができるし,また図面のコンパクトな 表現として用いることもできる. 認識は以下の2つのステージに分けることができる.

1)細線化やベクトル化など所定の前処理を行なった図面イメージに対して, 分野に依存しないルールによってシンボルを接続ラインから切り離す.

2) シンボルを認識しエラーを自動補正するためのドメインに特化した 認識方法のセットをサブシステムが強調的に動かす.

グラフィカルユーザインタフェースによって,残されたエラーをインタラクティブ に補正し,またエラーログを見ることができる. 異なるドメインのテキスト本やハンドブックから64の印刷図面を 選び,150dpiおよび300dpiにてスキャンしたイメージを使って実験を 行なった.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


フーリエ展開およびKL展開を使った多大なテンプレートセットの 高速なパターンマッチング
Use of Fourier and Karhunen-Loeve Decomposition for Fast Pattern Matching with a Large Set of Templates

Michihiro Uenohara, and Takeo Kanade

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

多大なテンプレートセットの高速なパターンマッチング方法を示す. フーリエ変換とKL変換という2つの展開によって高速化を実現している. 本アルゴリズムは局所的な未知の歪みの中でのオブジェクトのサーチに適している. 異なった歪みを持つパターンは、わずかに互いに異なり,また高く関連づけ られる. イメージベクトル空間は,KL変換による少しの固有ベクトルによって 効果的に表現するすることができる. 固有ベクトルによるベクトル部分空間が生成され,あらゆるイメージベクトルが 部分空間中の認識対象パターンとしてとらえられる. 未知の歪みを伴うオブジェクトのパターンマッチングは,以下のプロセスと して定式化される. すなわち,入力イメージの一部を抽出し,部分空間における抽出された部分に 最も似ているパターンを見つけ,それらの間の入力イメージにおける各位置 の正規化された相関性を計算し,そして最もスコアの高いロケーションを 特定するものである. 未知の歪みの中でのオブジェクトの探索は非常に計算量を要する. 前述の公式化によって,固有ベクトルに高い相関性を持つリファレンス イメージを分解し,そして,同様に,頻度領域でイメージを分解し, そしてプロセスをスピードアップすることが可能となる.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


モデル不適合の場合の逐次的決定について
On the Sequential Determination of Model Misfit

Peter Whaite and Frank P. Ferrie

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

様々な抽象レベルにおけるシーンや環境の特徴化に使うことの できる一般的な目的のためのモデルが存在するという仮定の もとに,コンピュータビジョンの多くの戦略が成り立っている. 通常の仮説は以下のようなものである. 選択されたモデルが特定の属性を表現するに十分である,とか, 適切な方法(例えばラインとエッジの位置特定, 部分または領域への分割,など)によって入力データが解析されれば 当該モデルのパラメータを推定することは可能である,など. 本論文では、それらの仮説がどのような場合に成り立たなくなるのか を決定する方法についての問題について述べる. 従来のアプローチは,仮定センサーノイズモデルに基づいた統計的な不適合尺度を 使用するものであった. 問題は,動作の正しさが,ノイズモデルの正確さにしばしば危険な依存を していることである. いくつかの見地による環境構造およびノイズの表現を構築する アクティブなアプローチのフレームワークや, 最小限の事前知識によって,この問題の回避を回避できることを示す.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


線接続性と線太さによる改良ハフ変換
Hough Transform Modified by Line Connectivity and Line Thickness

Mark C.K. Yang, Jong-Sen Lee, Cheng-Chang Lien, and Chung-Lin Huang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

接続性と太さに基づく,線検出のための改良ハフ変換について述べる. ノイジィなイメージにおいて,短い線分や太い線分の検出が容易に行なえる ものであり,理論面およびシュミレーションによって裏付けられるものである.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ウェーブレット変換ゼロクロッシング表現による二次元オブジェクト輪郭 の認識
Recognition of 2D Object Contours Using the Wavelet Transform Zero-Crossing Representation

Quang Minh Tieng and W.W. Boles

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

任意形状の二次元オブジェクトを認識する新しいアルゴリズムについて述べる. オブジェクト輪郭は,一次元の信号によってまず表現される。 この信号によって,オブジェクトのウェーブレット変換ゼロクロッシング表現 を構築する. このアルゴリズムは並行移動,回転,スケーリングに対して不変である. フーリエ記述子と比較すると,我々のアルゴリズムは,より安定して正確な 実験結果が得られる.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


アークリムーバルによるベイズ確信ネットワークの近似
Approximating Bayesian Belief Networks by Arc Removal

Robert A.van Engelen

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

アークリムーバルによるモデル単純化を通じたベイズ確信ネットワーク の近似のための一般的なフレームワークについて述べる. 近似ネットワークの事前および事後確率分布における,許される エラー絶対値の上限が与えられ,アークのサブセットが取り除かれ, それによって確率的推論がスピードアップされる.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


グレイレベル背景のドキュメントからのリファレンスラインの抽出に おけるマルチリゾリーション解析
Multiresolution Analysis in Extraction of Reference Lines from Documents with Gray Level Background

Yuan Y.Tang, Hong Ma, Jiming Liu, Bing Fa Li, and Dihua Xi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No.8, August 1997

ウェーブレットに基づいた,マルチグレイレベルドキュメントを処理する 新しい理論的方法について述べる. 本方法では,二次元のマルチリゾリューション解析,ウェーブレット分解 アルゴリズム,そして正直交ウェーブレットを使って,ドキュメントイメージを サブイメージへと変換する. これらのサブイメージによって,マルチグレイレベルドキュメントの リファレンスラインを抽出することができ,またドキュメントの幾何学構造 に関する知識を得ることができる. このアプローチは特に,グレイレベル背景のフォームドキュメントを処理するのに 一層効果的である. 本方式の効果は実験によって確かめられた.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.9


三次元空間における部分表面および立体のマッチング
Partial Surface and Volume Matching in Three Dimensions

Gill Barequet, and Micha Sharir

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.929-948, No.9, Sep. 1997.

本稿では、三次元画像における部分表面および立体のマッチングに関する新し い方法について述べる。 この問題では、まず3D空間上に二つの物体が与えられる。それぞれは点集合 で表現されている。 目的とするのは、一方の物体の剛体運動を見つけることである。 ただし、その物体の境界は、他方の物体境界の対応部分に十分近接しており、 かつ大部分を占めるものとする。 これは、パターン認識やコンピュータ・ビジョンにおける重要な問題の一つで あり、その応用は、工業、医学、化学など多岐にわたる。 我々の方法において、求めるべき幾何学的な運動は、回転と平行移動に分けて 取り扱われる。 このアルゴリズムは、回転の系列を通して動作するという意味では、最急降下 法のスタイルをとるが、回転に対するマッチングスコアの計算には、新しい方 法を用いている。 工業応用、医用画像、分子生物学からのデータを含む、様々なサンプルでの実 験結果について述べ、このアルゴリズムの正確でロバストなふるまいについて 示す。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


教師付き画像分割のための弛緩法
Relaxation Methods for Supervised Image Segmentation

Michael W. Hansen, and William E. Higgins

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.949-962, No.9, Sep. 1997.

教師付き画像分割のための二つの方法、すなわち、教師付き弛緩ラベリングと 流域駆動型(watershed-driven)弛緩ラベリングとを提案する。 これらの方法は、3D医用画像解析の問題に、特に適している。 というのは、これらの画像は大きく、位相幾何的に複雑で、エラー耐性が低い からである。 それぞれの方法では、教師信号としてあらかじめ定義された目印(cue)が用 いられる。 この目印は、アプリケーションによって、対話的、もしくは自動的に定義さ れる。 目印によって、統計的な領域の情報と位相幾何学的な制約条件が与えられる。 教師付き弛緩ラベリングは、ノイズに対して強く反発する性質を示す。 流域駆動型の弛緩ラベリングは、計算上効率のよいノイズ耐性法を与えるため に、流域解析と教師付き弛緩ラベリングの強みを結び付けたものである。 広範囲にわたる2Dと3D画像への実験結果によって、これらの方法の有効性 を示す。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


線形プッシュブルームカメラ
Linear Pushbroom Cameras

Rajiv Gupta, and Richard I. Hartley

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.963-975, No.9, Sep. 1997.

衛星画像にふつう用いられるプッシュブルーム(pushbroom)センサーのモデ ル化と解析は、困難でかつ計算上の負荷も大きい。 というのは、回転する地球のまわりの軌道を巡る衛星が動いており、軌道のダ イナミクスを含む数学的モデルが非線形であるからだ。 本稿では、プッシュブルームセンサーの単純モデル(線形ブッシュブルームモ デル)を導入する。 これは、計算上単純であると同時に、完全なプッシュブルームモデルと比較し て、同一時間内により正確な結果を与えるという利点をもつ。 リモートセンシングの他に、線形プッシュブルームモデルは他の多くの撮像系 アプリケーションにも有用である。 線形プッシュブルームモデルにとって、主要かつ標準的な写真測量上の問題を 解くために、単純で非反復的な方法を与える。 まず、地上管制地点からモデル・パラメータの計算を行い、次に、二つの画像 の対応付けから関連モデル・パラメータを決定し、そして、与えられた画像対 応付けと地上管制地点に対するシーン再構成を行う。 線形プッシュブルームモデルは、完全なモデルの近似として有効であるという 理論的洞察を導き出す。 線形プッシュブルームカメラのエピポーラー幾何について調べた結果は、透視 カメラのそれと全く異なっていることを表している。 それにもかかわらず、線形プッシュブルームセンサーのマトリクスに、基本的 な透視カメラのマトリクスと類似性があることが示される。 このことからわかるのは、シーンの決定は、線形プッシュブルームカメラを用 いた二つのビューから得られるアフィン変換にかかっているということである。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


局所的な粒度分析的サイズ分布によるオフラインサイン照合
Off-Line Signature Verification by Local Granulometric Size Distributions

Robert Sabourin, Ginette Genest, and Francoise J. Preteux

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.976-988, No.9, Sep. 1997.

オフラインサイン照合の分野における基本的な問題は、形状識別子と関連する 特徴に基づくサイン表現法がないことである。 その難しさは、主として、人の個性に密接に関係するサイン筆跡の局所的な変 動性にある。 本稿では、視覚に基づくサイン表現のための新しい形式化を提案する。 サイン画像は512×128画素からなり、矩形分割された網膜格子上に置かれる。 網膜格子は、それぞれにサイン局部の刺激を受ける。 粒度分析的サイズ分布は、着目する格子点上の網膜を刺激する信号の活動量を 特徴づける試みとして、局所的な形状識別子を定義するために用いられる。 この方法の評価実験は、20人よる800の直筆サインのデータベースを用いて行 われる。 二つの識別法、すなわち、最近傍識別法としきい値による識別法とにより、 ランダムに偽筆を含むなかで、誤認率はそれぞれ0.02%以下と1.0%以下を示し た。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


高次元の最近傍探索のための単純アルゴリズム
A Simple Algorithm for Nearest Neighbor Search in High Dimensions

Sameer A. Nene, and Shree K. Nayar

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.989-1003, No.9, Sep. 1997.

高次元空間において最近接点を求めるという問題は、パターン認識に共通する ものである。 残念ながら、k−d木やR木のような既存の探索アルゴリズムのほとんどにつ いて、その複雑さは次元数とともに指数関数的に大きくなり、15次元ほどを越 えると実行できないものとなる。 ほとんどすべてのアプリケーションにおいて、最近接点として興味があるのは、 ユーザーに指定された距離ε以内にあるものに限られる。 ユークリッド距離ε以内にある最近傍を効率よく探索する、単純で実用的なア ルゴリズムを表す。 それは、新しいデータ構造と射影探索を用い、高次元での性能を劇的に改善す る。 ここで表した複雑さ解析は、構造的な問題でεを自動的に決定する助けとなる。 広範囲にわたるベンチマークにより、様々な構造的、非構造的探索問題に対し て、提案したアルゴリズムが優っていることが示された。 応用例として、物体認識について示す。 このアルゴリズムの単純さは、それと同等のソフトウェアよりも百倍速い、安 価なハードウェアの探索エンジンを構築することを可能にする。 C++により実現したアルゴリズムは、search@cs.columbia.edu/CAVE/ に要 求すれば利用可能である。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像形成システムからのセンサー入力に基づく自動標的認識および標的認識支援
Aided and Automatic Target Recognition Based Upon Sensory Inputs From Image Forming Systems

James A. Ratches, C.P. Walters, Rudolf G. Buser, and B. D. Guenther

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.1004-1019, No.9, Sep. 1997.

本稿では、いくつかの軍の研究所が、物体認識アルゴリズム、プロセッサー、 評価技術に関して行った10年間の研究について、体系的に概観する。 軍では、物体認識の適用対象は軍事的標的の識別であり、これには人間によ る操作支援から自律操作までが含まれる。これは、自動標的認識と呼ばれる。 ここで述べる研究は、人間の介在する標的認識という応用に集中しているが、 自動処理についても幾ばくかの関心を払っている。 開発されてきた定義と性能測度を、現在の到達水準を示す性能データともに 述べる。 S/Nおよび擾乱パラメータの影響が、データの中で示される。 多重センサー融合とモデルベースなアルゴリズムについては、軍研究界によ って熟考された最新の技術として論じられる。 その結果は、有用な性能が達成され得たことと、現実世界の条件下での性能 を理解し改善するためのツールが進化していることを示すものである。 ここで言及する研究が強く示しているのは、画像科学の発展の必要性である。 それは、本稿で述べたように、自動標的認識の理論的基盤を支えるためであ る。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


散乱光下の Shape from Shading の正確な再現に向けて
Toward Accurate Recovery of Shape from Shading Under Diffuse Lighting

A. James Stewart and Michael S. Langer

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.1020-1025, No.9, Sep. 1997.

陰影、乱反射、面方向を混合させる散乱光に関する新しい表面放射モデルにつ いて述べる。 散乱光下の shape from shading を計算するために、このモデルを用いるアル ゴリズムを示す。 このアルゴリズムに対して、合成画像と実画像によるテストが行われ、この問 題に関する従来のアルゴリズムに比べ、より正確に動作することがわかった。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


探索部分空間を用いる法線のフローからの頑健なエゴモーション評価
Robust Egomotion Estimation From the Normal Flow Using Search Subspaces

Cesar Silva and Jose Santos-Victor

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.1026-1034, No.9, Sep. 1997.

未知環境の中で、任意の平行移動と回転運動をする単眼視観測系のエゴモー ション(訳者注:カメラの動き)評価の問題について述べる。 提案する方法は、空間−時間的画像差分、もしくは法線のフローに基いた、 ユニークなものである。 探索のパラダイムは、法線フローフィールドの幾何学的性質に基き、エゴモ ーションパラメーターを評価するために、部分探索空間の集まりを考えるこ とにある。 様々なアルゴリズムが、この枠組みの中で提案された。 評価方法のノイズ感度を下げるために、頑健な回帰理論に基づく統計的手段 を使用する。 最後に、様々な種類のカメラの動きに対し、合成画像と実画像を用いた広範 な実験について述べ、議論する。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


多重隠蔽物体の変形テンプレート認識
Deformable Template Recognition of Multiple Occluded Objects

Kanti V. Mardia, Wei Qian, Druti Shah, and Kevin M.A. de Souza

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.1035-1042, No.9, Sep. 1997.

本稿では、変形テンプレートに基き、多重隠蔽物体の、完全で柔軟なベイズ識 別システムを定式化する。 対象物体の数の増加に伴う計算上のコストの増大を防ぐため、モデルの様々な 局所依存性を獲得する。 合成画像とマッシュルームの実画像に対する結果の数値について議論する。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


部分的に隠蔽された物体の安定した照合のための 固有ウィンドウの可検出性、単一性、信頼性
Detectability, Uniqueness, and Reliability of Eigen Windows for Stable Verification of Partially Occluded Objects

Kohtaro Ohba, and Katsushi Ikeuchi

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.1043-1048, No.9, Sep. 1997.

本稿では、固有空間にある物体の部分的な外観を多数蓄えた、「固有ウィンド ウ法」と呼ばれる固有空間解析法を用いて、bin-picking 問題のための部分的 に隠蔽された物体を認識する方法について述べる。 そのような部分的な外観は多量のメモリー空間を必要とする。 ウィンドウにおける可検出性、単一性、信頼性という3つのものさしを、冗長 なウィンドウを無視し、それによってメモリーの必要量を削減するために開発 した。 ポーズ分類手法を用いて、物体のポーズと物体のタイプを決定する。 我々は、この方法を実現し、その有効性を実証した。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


碁における多目的戦略計画
Multipurpose Strategic Planning In the Game of Go

Shui Hu, and Paul E. Lehner

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.1048-1051, No.9, Sep. 1997.

碁での多目的計画の問題のために開発された、対敵計画における経験的な方法 について述べる。 戦略上および戦術上のいずれのレベルでも、静的な解析と動的な先読みが用い られ、これによって可能性のあるゴールの生成と、様々なゴールの達成可能性 のなかでの相互作用の特定とがなされる。 戦略的で多目的なゴールは、相互作用のあるゴールの集合からなる。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


成長変換に基づく確率評価からの確率論的文脈自由文法の整合性
Consistency of Stochastic Context-Free Grammars From Probabilistic Estimation Based on Growth Transformations

Joan-Andreu Sanchez and Jose-Miguel Benedi

IEEE Trans. Pattern Anal. Machine Intell., Vol.19, pp.1052-1055, No.9, Sep. 1997.

確率過程的な文脈自由文法(SCFGs:Stochastic Context-Free Grammars)の確 率推定に関して重要な問題は、推定されるモデルの整合性の保証にある。 この問題は文献[3]、[14]で考えられた。 そして、文献[10]、[4]では、あいまいさのない SCFGs のみを対象として、研 究がなされた。つまり確率分布が学習サンプルにおける相対度数によって推定 される場合である。 本稿では、この結果を拡張するのだが、それは、 「整合性という特質が拘束条件なしにすべてのSCFGsに対して保証される」という ことを証明することでなされる。 このとき、確率分布は、古典的な Inside-Outside アルゴリズムと Viterbi アルゴリズムから学習されるのだが、このいずれも成長変換に基づいている。 これらの結果に関する、他の重要な確率的性質もまた証明される。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.10


特徴抽出に適応的ウエーブレットを用いた分類
Classification Using Adaptive Wavelets for Feature Extraction

Yvette Mallet, Danny Coomans, Jerry Kautsky, and Olivier De Vel

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: r class category, s set of high-pass filter coefficients l, level of decomposed data or level of the discrete wavelet transform, t band at some level of the discrete wavelet transform, n number of cases, p dimensionality or number of variables.

スペクトルデータの分類における主な関心は、 変数の数や次元が利用可能なスペクトルの数を越えることである。 このことは、伝統的に好まれてきた分類器の性能の本質的な悪化につながる。 そこで、扱えるサイズまで変数の数を減らす必要があるが、 同時にできるだけ識別能力のある情報を保持する必要がある。 適応的ウエーブレットに基づく革新的な方法を提案する。 この方法は、次元数を減らし、識別能力のある情報を最適化することを 目的としている。 分類に用いるウエーブレット係数を得るために、 離散的なウエーブレット変換を用いる。 標準的なウエーブレット基底の一つを使うのではなく、 それぞれの基準を最適化するウエーブレットを生成する。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像パターン認識における大規模なシミュレーションの研究
Large-Scale Simulation Studies in Image Pattern Recognition

Tin Kam Ho, Member, IEEE, and Henry S. Baird, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Pattern recognition, classifier, document image analysis, character recognition, image defect model, simulation, intrinsic error, Bayes risk, asymptotic accuracy.

画像パターン認識における多くの問題は、クラス毎のばらつきが大きく 単純で解析的な関数では良い近似はできない、ということに起因する。 シミュレーションの研究によってこれらの問題を克服する方法を得る。 我々は関連した3つの印刷文字認識の研究について述べる。 これらの研究は、文書画像の劣化の陽的な確率過程モデルに一致する 疑似ランダム的な生成データに依存している。 非常に大規模な実験(数百万サンプル)によって、実在の画像認識の問題の 本質的な難しさ(ベイズ危険)やさらに分類器のおよその精度、能力を正確に 見積もることができる。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


空間依存のフーリエ解析:指数チャープ変換
Space-Variant Fourier Analysis: The Exponential Chirp Transform

Giorgio Bonmassar, Student Member, IEEE, and Eric L. Schwartz

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Logpolar mapping, rotation scale and shift invariance, attention, space-variant image processing, Fourier analysis, nonuniform sampling, real-time imaging, warped template matching.

空間依存な、つまり foveating なビジョンのアーキテクチャは、 マシンビジョンと生物学的ビジョンの両方にとって重要である。 本論文では、特定の空間依存マップ、すなわち対数極マップに注目する。 対数極マップは霊長類の視覚マップを近似し、また過去20年間に 多くの研究者によってマシンビジョンに適用されてきた。 対数極マップに関連して、我々は新しい線形積分変換を定義し、 これを指数チャープ変換と呼ぶ。 この変換によって空間依存な画像フォーマットに対する周波数領域の画像処理が 行え、一方で通常のフーリエ変換の特性であるシフト不変性を保持している。 さらに、周波数の対数極座標変換(Mellin変換に類似している)によって、 高速な指数チャープ変換が行えることを示す。 これは変換された空間においてサイズ、回転、さらにシフトに対して 不変な性質を示す。 最後に、高速指数チャープアルゴリズムをテンプレートマッチング問題の 画像データベース、および空間フィルタリングへ適用した例について述べる。 もし空間依存な画像処理においてアルゴリズムの不足な部分があるならば、 高速指数チャープ変換が、この分野における基本的なツールとなることが 期待される。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3次元線分集合マッチングとその多角円弧マッチングへの応用
Matching Sets of 3D Line Segments with Application to Polygonal Arc Matching

Behzad Kamgar-Parsi, Member, IEEE, and Behrooz Kamgar-Parsi, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Curve matching, polygonal arcs, 3D registration, segment matching, 3D arcs.

本論文では、同じ長さの3次元線分の2つの集合について考察する。 2つの集合間の最も良いマッチングを与える座標変換(回転と変換)の 閉形式解を導く。 最も良いマッチングとは、集合間の最小自乗距離による計測の意味においてである。 これらの結果を、コンピュータビジョンにおける他の問題を解くのに 効果的なアルゴリズムを構築する基礎として使う。 具体的には、多角円弧のマッチングの問題、即ち短い円弧と長い円弧の一部分の マッチングの問題について示す。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


"Brownian Strings":確率過程的に変形可能な輪郭を用いた画像分割
"Brownian Strings": Segmenting Images with Stochastically Deformable Contours

Robert P. Grzeszczuk and David N. Levin

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Image segmentation, image processing, edge detection, active contours, simulated annealing, optimization, state space search.

本論文では画像分割法について述べる。 本手法では、適当な形の輪郭が対象物の周囲に一致するまで確率的に変形する。 輪郭の発達はシミュレーテッド・アニーリングによって制御される。 その結果、輪郭は画像から導かれるエネルギー関数の大局的最小値に落ち着く。 ノンパラメトリックなエネルギー関数は、 前に分割された画像の統計的な性質から導き出される。 それによって、前の結果が一つに統合される。 この方法は、最良の大局的特性を有する輪郭に対する状態空間探索に基づいており、 ノイズがあっても安定している。 連結性のような局所的な基準に基づいた方法では、ノイズがあると安定しない。 スネークや他の動的な輪郭のアプローチとは違い、この新しい方法は 不規則に変形した輪郭を扱うことができる。 この不規則に変形した輪郭には、独立した自由度を表現する画素間のかけがある。 さらに輪郭はエネルギーの大局的最小値に向かって発達するので、 この方法はスネークアルゴリズムよりも全自動のアプリケーションに適している。 スネークアルゴリズムは、輪郭が局所最小値に捕まる度に初期化しなければ ならないからである。 輪郭の長さとは独立にランダムで局所的な摂動を効果的に導入すること、 摂動の大きさを制御すること、 結果の変形が影響されないと保証することによって複雑な計算が不要になる。 この方法を、頭部の磁気共鳴画像から脳の表面を探し出したり、 の血管を追跡するのに適用して説明する。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


COSMOS-A 3D自由形物体の表現法
COSMOS-A Representation Scheme for 3D Free-Form Objects

Chitra Dorai, Member, IEEE and Anil K. Jain, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Free-form objects, sculpted surfaces, arbitrarily curved objects, 3D object representation, shape index, spherical map, shape spectrum, view matching, object recognition.

我々は以下のような条件の3D自由形物体の表現と認識の問題について述べる。

1)物体に対して自由な視点

2)物体は様々な形と複雑さを持つ

3)物体の表面のタイプについて限定的な仮定がない

オクルージョンのない3次元剛体の視野を含む 情景の距離画像が用意されていると仮定する。 自由な形(へこんでいる)の表面を持つ物体の認識のための、 新しく汎用的な表面表現方法を提案する。 この方法では物体を不変な形のインデックスの極大表面パッチの立場から 簡潔に記述する。 物体を表現する極大パッチはその方向によって単位球上にマップされ、 形スペクトル関数によって集められる。 局所的及び大局的な情報を捕らえるのに必要な、 表面の領域、曲率、連結性のような特性は表現の中でも構築される。 この方法は物体認識に有用な、意味のある豊富な記述を提供する。 新しい概念である物体の「形スペクトル」も、 物体の視野のグルーピングやマッチングのためのcosmosの構成の中で紹介する。 我々の方法の汎用性と効果を複雑な物体の距離画像を用いて説明する。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


距離データを用いた物体視野の最適な登録
Optimal Registration of Object Views Using Range Data

Chitra Dorai, Member, IEEE, John Weng, Member, IEEE, and Anil K. Jain, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Image registration, view transformation estimation, view integration, automatic object modeling, 3D free-form objects, range data.

本論文では不確実性やノイズを含む深さデータを持つ物体視野の、 ロバストな登録法について述べる。 3D物体の多視点を登録する際の誤差は、 物体モデルの自動的な構築をする際の視野統合にシビアに影響する。 我々は3D物体の2つの視野の距離画像から、 視野変換パラメータを正確に計算するために、 最小分散推定量(MVA)を導き出す。 実験結果によると、MVEを用いて求めた視野変換推定は、 登録のために重みなしエラー基準を用いて計算した場合よりも明らかに 正確である。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


形スペクトルに基づく3D自由形物体の視野のグルーピングとマッチング
Shape Spectrum Based View Grouping and Matching of 3D Free-Form Objects

Chitra Dorai, Member, IEEE, and Anil K. Jain, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Index Terms Free-form objects, sculpted surfaces, 3D object representation, cosmos, shape spectrum, clustering, view matching.

認識における効果的なマッチングのための、 3D自由形の視野の見方を構築する問題について述べる。 「形スペクトル」特徴に基づいた新しい視野表現を示し、 複雑な形の物体の複数の視野を簡潔で同種のクラスターに統合する 汎用的で強力な方法を提案する。 我々の視野グルーピング方法は、表面分割とエッジ抽出を必要としない。 20の自由形物体から人工的に生成した6,400枚の視野と 10の凹な物体の現実の距離画像100枚に対する実験によると、 形スペクトルに基づいたモデル視野選択法において良い性能を示した。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


カラー画像における決定論的な局所構造の照明不変なマッチング
The Illumination-Invariant Matching of Deterministic Local Structure in Color Images

David Slater, Student Member, IEEE, and Glenn Healey, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Computer vision, machine vision, color, color vision, color constancy, recognition, invariant recognition, local methods.

画像の各画素の多重スペクトル測定によって、 認識のための重要で付加的な情報を得ることができる。 空間的な情報が限定されている場合に、スペクトル情報は非常に重要である。 即ち、小さい物体の認識や、部分的に隠蔽された物体の小さな特徴の認識 などである。 カラー画像における決定論的な局所構造のための特徴行列表現を導入する。 特徴行列は認識に有用であるが、この表現は照明のスペクトル特性に依存する。 表面のスペクトル反射のための、カラーバンドの数と同じ数のパラメータを有する 線形モデルを用いて、照明のスペクトルの変化は特徴行列の線形変換に対応し、 画像平面の回転は行列の循環シフトに対応することを示す。 これらの関係から、これらのシーン変換に対して不変な局所的な表面の構造を 認識するアルゴリズムを導き出す。 実物体の画像における実験を通してアルゴリズムを示す。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


デジタル画像の幾何とカラー補正
Correcting the Geometry and Color of Digital Images

Jackowski, A. Goshtasby, Senior Member, IEEE, S. Bines, D. Roseman, and C. Yu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Geometry correction, color correction, approximation, parametric surface, rational Gaussian surface.

デジタル画像の幾何とカラーの補正を統合した方法について述べる。 本方法は既知のカラーパッチが並んだカラーチャートを用いる。 チャートの本当の幾何とカラー及びチャートの画像の幾何とカラーを用いて、 カメラの幾何とカラー特性を記述する変換関数を決定する。 それから変換関数を用いて得られた画像の幾何とカラーを補正する。 提案した方法を異なる照明とカメラのセッティングの元で撮影された画像に 適用した実験の結果を示し、評価する。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ピンぼけ画像を復元する様々なアプローチ
A Variational Approach to Recovering Depth From Defocused Images

A.N. Rajagopalan and S. Chaudhuri

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Depth from defocus, space-variant blur, complex spectrogram, Wigner distribution, space-variant filtering, regularization, Euler equation.

本論文では空間周波数表現(SFR)の構成を使ってピンぼけ画像の深さ(DFD)問題 の解法を提案する。 なめらかさはぼけパラメータの推定に拘束されており、 DFD問題に対する様々なアプローチを開発した。 特に深さ復元のために、多くのSFRの中で複素スペクトグラムと Wigner分布の応用について研究する。 提案した様々な方法の性能を人工的な画像と実画像の両方に 対してテストした。 ぼけパラメータによるなめらかさの拘束を用いないで得た場合より はるかにいい結果を得ることができた。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


離散ボロノイ図とSKIZオペレータ:動的アルゴリズム
Discrete Voronoi Diagrams and the SKIZ Operator: A Dynamic Algorithm

Raúl E. Sequeira, Member, IEEE, and Françoise J. Prêteux

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Incremental method, degenerate seed configuration, image segmentation, Euclidean distance function, point-location problem.

ボロノイ図(VD)は、画像のsupport(訳者注:画像を表現する台・枠のよう なもの、例えば画像配列)を分割する一般的な方法である。 ボロノイ領域を決定するシードをセットしたときにVDを構成するアルゴリズムを示す 。 このVDはシードを加えたり取り除いたりすることで更新できる。 VDを更新するために変更される画素とシードの数や、 シード間の隣接関係は最小になる。 循環シードに関する結果を示す。 VDの隣接グラフまたは2分木グラフは容易に得ることができる。 「影響領域による骨格」の構成に本アルゴリズムを適用した結果を示す。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


なめらかに拘束されたカルマンフィルター
A Smoothly Constrained Kalman Filter

Jan De Geeter, Member, IEEE, Hendrik Van Brussel, Fellow, IEEE, Joris De Schutter, Member, IEEE and Marc Decréton

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Smoothly constrained Kalman filter, nonlinear constraint, perfect observation, linearization error, recursive estimation.

本論文は非線型拘束のための、なめらかに拘束されたカルマンフィルター(SCKF) について述べる。 拘束とは状態変数間に存在する関係である。 拘束を完全な観測として扱う。 しかしながら線形化誤差によって正しい値に収束しなくなる。 それゆえ、SCKFはほとんど完全な観測かまたは同等である弱い拘束として 非線型拘束を繰り返し適用する。 新しい測定の統合はこれらの反復で組み合わされ、 線形化誤差を減少し、それゆえ他の反復的な方法に比べて収束性が向上する。 (変数を)弱めることは非線型拘束の分散を人工的に増加させることで行う。 弱める変数をどのように選ぶか、また拘束の繰り返し適用をいつ始め、 いつ終えるかについて説明する。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


適応的ハフ変換を用いた複数物体の3D動きの復元
Recovering 3D Motion of Multiple Objects Using Adaptive Hough Transform

Tina Yu Tian and Mubarak Shah, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 10, October 1997

Keywords: Multiple-motion analysis, segmentation, structure-from-motion, robust estimation, adaptive Hough transform.

適応的なハフ変換を用いて、2つの透視投影から複数物体の3D動きと構造を 決定する方法について述べる。 我々の方法では3D剛体拘束に基づいて分割を決定する。 5次元の変換と回転パラメータ空間中の解の候補を探索するのではなく、 2次元変換空間だけを調べる。 入力画像を重なり合うパッチに分解し、変換空間のそれぞれの標本に対して パッチの回転パラメータを最小二乗当てはめを用いて計算する。 それぞれのパッチは5次元のパラメータ空間の標本に投票する。 複数の動きを含むパッチに対して、パッチ内の顕著な動きの回転パラメータを 計算するために再降下M推定量を用いる。 通常の多次元ハフ変換の計算量と記憶容量を減少するために、 また適切なパラメータ空間を「全体から詳細へ」というやり方で反復的に 更新するために適応的ハフ変換を用いる。 我々の方法は、3D動きパラメータをロバストに復元でき、 フロー推定の孤立値を拒否でき、 そしてシーン中の現在動いている複数物体を扱える。 提案手法を人工的な画像と実画像に適用したところ、有望な結果が得られた。

Y.A.

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.11


ブートストラップによる性能評価
Performance Assessment Through Bootstrap

Kyujin Cho, Peter Meer, Senior Member, IEEE, and Javier Cabrera

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Performance evaluation, edge detection, bootstrap.

コンピュータビジョンに対する新しい性能評価の枠組みを提案する。 現実世界では、入力データや計算処理の複雑さのために従来の 誤差伝播手法が使えない。 新しいアプローチは統計学に最近導入されたリサンプリング技術である ブートストラップを利用する。 入力データの無用な性質、すなわち、理想的な条件下では出力には何の 関連もないような性質に揺らぎを与えることによって、出力値の分布を 得るというものである。 これらのブートストラップ分布から、与えられた入力データに関して その計算処理がおいた仮定が十分であるかどうかの信頼度が導かれる。 例として、エッジ検出の工程に対してこの新しい枠組みを適用する。 いくつかのエッジ検出法の性能を人工データおよび実画像の両方について 比較する。出力における信頼度を用いて勾配の大きさに依存しないエッジ画像を 得ることができる。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ステップ・エッジ検出の性能評価に対するCanny基準の離散表現
A Discrete Expression of Canny's Criteria for Step Edge Detector Performances Evaluation

Didier Demigny and Tawfik Kamli

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Edge detection, Canny criteria, edge operators, localization criterion.

エッジ検出に使われる最適なフィルタは普通、連続領域について作られ、 それから離散領域へのサンプリングによって置き換えられる。 一方、Sobelフィルタのような簡単なフィルタは直接、離散領域で定義されている。 エッジ検出に関するこれまでの研究のほとんどは、最適なフィルタを作り上げる ためのものであったが、それらを比較する方法について述べたものはほとんどない。 本論文では、異なるフィルタの性能を、それらが使われる領域:離散領域上で 比較する基準を定める。 Cannyは、ステップ・エッジ検出に対する最適フィルタの式を導くのに、3つの 基準を定めた:(1)検出の良好さ、(2)局所化の良好さ、(3)低応答の多様さ、 である。 それらの基準はフィルタを比較するためのすぐれた候補だと思われるが、 あいにく連続領域上で与えられており、それらの解析的表現を離散領域で 用いることはできない。 従来の研究と異なり、我々のアプローチは離散領域での直接計算にもとづき、 Cannyと同じ意味を持つ3つの基準を設けた。 いくつかの実験結果との比較により、このアプローチが妥当であることが 確かめられる。 連続的な空間領域でのフィルタの応答がその中心で連続であるか否かによって 区別される2種の微分演算子が存在することが、本研究で明らかとなった。 これらの種別は第2、第3の基準に対するかなり異なった性質を表す。 我々は第1、第3の基準の使用を平滑フィルタへ拡張した。また、連続的な第3基準 にしたがって最適な連続フィルタを定め、離散的な第3基準にしたがって 最適な離散フィルタを定めた。 テスト用の連続フィルタと離散フィルタの性能を比べたところ、連続フィルタの 方は、サンプリングによって重なり合うスペクトルを低減させていても、 テストデータに対して最適ではないことがわかった。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


自動染色体分類に用いられる部分重なりを持つ非剛体の幾何学的分割
Geometric Separation of Partially Overlapping Nonrigid Objects Applied to Automatic Chromosome Classification

Gady Agam, Student Member, IEEE, and Its'hak Dinstein, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Object recognition, image segmentation, computational geometry, shape decomposition, biology computing, chromosome analysis.

細胞遺伝テストにおける一般的な作業は、人間の染色体の分類である。 メタフェーズ画像において接触したり重なり合った染色体をうまく分割 することが正しい分類のために重要である。 自動染色体分類を行なう従来のシステムはほとんどが対話式であって、 染色体の接触や重なりを正しく分けるのに人間の介在を必要としていた。 染色体は非剛体であるから、それらの切り分けには特別な分割手法が 求められる。接触した染色体を分けるための一般的な手法はあいまいさや 不完全な情報があるところではうまくいかないものだし、重なった染色体を 分けることはできない。 提案するアプローチは分割問題を同定問題として扱い、このやり方で 重なった染色体の分割を遂行する。 このアプローチは対象に関する低レベルの知識を取り込んでおり、 抽出できた情報しか用いない。それゆえ高速で、分割路の存在には 依存しない。 本論文で述べる方法は、接触や重なりを持つ非剛体の分割を必要とする 他のアプリケーションにも用いることができる。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


電荷分布シミュレーションを用いた3次元パート分割
3D Part Segmentation Using Simulated Electrical Charge Distributions

Kenong Wu, Member, IEEE, and Martin D. Levine, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Computer vision, 3D, range data, shape, part segmentation, physics-based vision, electrical charge density distribution, finite element, surface triangulation, surface characterization.

3次元パート分割の新しいアプローチを与える。物理的事実としてよく知られる ように、導体表面上の電荷は鋭角な凸部に集まり、鋭角な凹部からは消失する。 このように、通常は鋭角な凹面によって表される物体のパート境界は、物体 表面上の電荷分布をシミュレートし、電荷密度が極小となる位置を見つける ことで検出できる。 まず3次元物体の単視点もしくは複視点距離画像について、三角状メッシュの 集まりで表された物体表面上の電荷密度分布をシミュレートする。 電荷密度の極小位置を追跡して大きな凹面を検出し、それらの点で物体を 複数のパートに分割した。 電荷密度の計算には面の滑らかさについての仮定を必要とせず、重みづけされた 大局的データを用いて、パート分割のためのロバストな局所面を生成する。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


先験的学習とギブスの反応-拡散
Prior Learning and Gibbs Reaction-Diffusion

Song Chun Zhu and David Mumford

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Visual learning, Gibbs distribution, reaction-diffusion, anisotropic diffusion, texture synthesis, clutter modeling, image restoration.

本論文はビジョンの前処理における2つの重要なテーマを取り上げる: まず一組の自然画像から、それらの普遍的な統計を学習するための新しい 理論(典型的な背景のある自然のシーンに対する先験モデル)を与え、 次いで、画像処理に対する反応-拡散方程式を設計する一般的な枠組みを 提案する。 始めにスケール不変な性質を持つ自然画像の統計を調べ、そして以前の2つの 論文で述べた最小エントロピー理論にもとづき、観測された統計を再現 する汎用的な先験モデルを見い出した。 その結果、ギブス分布は次の形のポテンシャルを持つ。 U(I,Λ,S) = Σ{α=1〜K} Σ{(x,y)} λ[α]((F[α]*I)(x,y)) ここで S = {F[1], F[2], ..., F[K]} はフィルタの組であり、 Λ = {λ[1], λ[2], ..., λ[K]} はポテンシャル関数である。 そのギブス分布は、すでに存在する線プロセスのような先験モデルの形式を 裏付けるものであり、また改善するものであるが、従来のモデルとは 対照的に、逆ポテンシャル(すなわち|x|の減少関数λ(x))が不可欠である ことがわかった。 U(I,Λ,S)における勾配降下により与えられる偏微分方程式は本質的に 反応-拡散方程式であることがわかった。 ここで通常のエネルギー項は非等方拡散を生じ、逆エネルギー項 は好ましい画像の特徴を強調するような、パターン形成に関する反応を生じる。

We illustrate how these models can be used for texture pattern rendering, denoising, image enhancement, and clutter removal by careful choice of both prior and data models of this type, incorporating the appropriate features. 先験モデルと適当な特徴を補完するデータモデルの両者をうまく選ぶこと により、これらのモデルがテクスチャパターンのレンダリングやノイズ除去、 イメージ強調、背景除去などにどのように用いられるかを示す。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


高信頼度認識に必要なデータ量を評価するための統合モデル
An Integrated Model for Evaluating the Amount of Data Required for Reliable Recognition

Michael Lindenbaum, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Object recognition, localization, pose estimation, similarity measures, noise models, performance analysis.

多くの認識手法が、特徴データのサブセットと、対応する物体が存在する ことを示す仮説との一致性をみている。 ここでは確率モデルを用いてそのような手法の性能を解析し、もし一致すれば 仮説の妥当性を任意の信頼度で保証するような、データのサブセットの十分な サイズへの表式を与える。 まずは2次元物体とアフィン変換クラスに限定し、統合モデルを与える。 このモデルには、物体の形状や収集されたデータの精度、シーン中に存在する ノイズ、変換のクラス、局部化の精度、仮説に求められる信頼度が 考慮されている。 おもしろいことに、これらの要因のほとんどは一つのパラメータで計れる ことがわかった。そのパラメータは「有効類似度」を表し、十分な サブセットのサイズを主に決定する。 この解析は、モデル物体に対応するインスタンスのクラスと変換群を 測度空間のメンバーとして表すこと、およびインスタンスのばらつきを 測度カバー率によって計ることにもとづいている。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ノイズを含むまばらな3次元データからの面、3次元曲線、および接合点の推定
Inference of Surfaces, 3D Curves, and Junctions From Sparse, Noisy, 3D Data

Gideon Guy and Gerard Medioni, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Segmentation and feature extraction, human visual perception issues, isosurface extraction.

正しくないノイズサンプルを含むまばらな3次元データから、密な面情報を 取得する問題に取り組んだ。 入力データは点、あるいは接線や法線方向を伴った点の列からなり、 位置や方向がノイズで乱されていてもよいとする。 ほとんどのアプローチが、この問題を補間問題として扱い、 ある評価関数を最小化するように膜や薄板のような面をあてはめる ことによって、これを解いている。 我々の主張は、それらの物理的な拘束条件だけでは足りないというものであり、 十分な連続性と「共面性」のような、さらなる知覚的拘束を加えることを 提案する。 それらの拘束により、面を推定するだけでなく、面方向 の不連続性や面の接合点の検出までを、すべて同時に行なうことができる。 このアプローチは面の種類や不連続の数、物体の数についての制限を 増やすことがなく、また反復的な手法でもない。結果はそれぞれ、 面、面同士の交線(すなわち3次元上の曲線)、そして3次元上の接合点 に対する3つの密な特徴マップとして得られる。 それから特徴マップを用いて「展開」処理を実行させる。 すると、面や曲線や接合についての情報がはっきりするような 表現(例えば三角型メッシュ)を作ることができる。 従来の展開処理は、面方向の向きが局所的に必ずしも整合していないため、 改良しなければならない。 これら3つのマップは現在のところ統合されていないが、これは研究中の課題 である。 異なる曲率を持ち、種類も異なる、複数物体のさまざまなデータを、 コンピュータで生成したり実データから用意し、それらについての結果を 示す。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


サブピクセルエッジ局在化誤差の推定と補完
Estimation and Compensation of Subpixel Edge Localization Error

Federico Pedersini, Augusto Sarti, and Stefano Tubaro

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Feature extraction, edge localization, subpixel detection.

サブピクセル単位のエッジ局在化手法(EL)について、 局在化誤差のうち、系統誤差の部分を補うことによってその性能を 向上させるための方法を提案し、解析する。 この方法はテスト画像の統計解析によるEL特性値の推定をベースとしており、 用いられるEL手法には依存しない。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ルール評価によるシーン理解
Scene Understanding by Rule Evaluation

Walter F. Bischof and Terry Caelli

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Conditional rule generation, machine learning, object recognition, scene understanding, visual learning.

複雑なシーンの中で、いくつかの部品から構成される物体や構造を識別する のに、機械学習をどのように役立てるかを考察する。 まず、部品の属性とそれらの関係を用いて構造を記述するために設計された、 条件つきルール生成法(CRG=conditional rule generation technique)に ついて論ずる。 そして、生成されたルールが領域ラベリングに対してどのように用いられるか を示し、ルールベースの物体認識を改良するために拘束伝播法を試した。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


距離画像の切り出しとモデリングのための超2次曲面
Superquadrics for Segmenting and Modeling Range Data

Ales Leonardis, Ales Jaklic, and Franc Solina

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Range image segmentation, recover-and-select paradigm, recovery of volumetric models, superquadrics.

超2次曲面モデルによって距離画像から各部品の記述を 信頼性高く効率的に復元する新しいアプローチを与える。 超2次曲面が切り出しが行なわれていないデータから直接復元できることを 示す。このため、いかなる切り出し前処理(例えば面への変換)も不要となる。 このアプローチは復元−選択パラダイムにもとづいている。実在の距離画像 と人工的な距離画像についていくつか実験を行ない、その結果が観測点や ノイズに関して安定であることを示す。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


隠れマルコフメッシュモデルの数値的ベイズ解析
Computational Bayesian Analysis of Hidden Markov Mesh Models

A.P. Dunmur and D.M. Titterington

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Bayesian inference, Gibbs sampling, hidden Markov Mesh random field, Markov chain Monte Carlo.

画像解析において時おり用いられる隠れマルコフメッシュのランダム場の データを解析するために、Gibbs標本化のようなものを導入する。 それによって、扱いにくかった上記の問題のベイズ解析に対し、 数値的にアプローチすることができる。 詳細な定式化をDevijverのマルコフメッシュモデルにもとづくある例に ついて与え、計算はBUGSパッケージを用いて行なう。 その理論的な側面を論じ、画像解析にもとづく数値実験の結果を報告する。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


形状を表す特徴量と分類木の帰納的な統合
Joint Induction of Shape Features and Tree Classifiers

Yali Amit, Donald Geman, and Kenneth Wilder

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Shape quantization, feature induction, invariant arrangements, multiple decision trees, randomization, digit recognition, local topographic codes.

2次元図形に対する非常に多くの2値特徴群を導入する。特定の図形を 区別するための顕著な特徴は、分類木を作成する際の帰納的学習に よって決定される。 局所的な形状を表すコードの可能な幾何学的配置のそれぞれに対して、 特徴が一つ存在する。それらの配置は相対角度とコード間距離への 大まかな拘束を表現し、多くのアフィン変形や非線形変形に対して ほぼ不変である。 それらはまた部分的に順序づけられ、木の各節において有用な特徴を 探索する範囲を狭められるようになっている。 それぞれの木は形状のうちの異なった側面を表すが、ランダム性が入る ためにそれらの統計的な相関は弱く、簡単な方法で統合できる。 いったん学習サンプルを用意すれば、あとはすべて自動的に、 アルゴリズムをその図形群に適応させることができる。 ためしにデータベースNISTの手書き数字を分類させたところ、エラー率は 0.7%であった。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


中間レベルのグループ化モジュールの性能を特徴づけるための枠組み
A Framework for Performance Characterization of Intermediate-Level Grouping Modules

Sudhir Borra and Sudeep Sarkar

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 11, November 1997

Keywords: Perceptual organization, performance evaluation, analysis of variance, ANOVA, experimental vision, intermediate level computer vision, feature grouping, performance characterization.

拘束検索とインデクシングベースの物体認識において、グループ化 モジュールを評価するための5つの性能指標を与える。 これらの指標を用い、統計的ANOVAテストにもとづく適正な実験の枠組みを 示す。そして航空機に関する50の画像を使って、エッジベースの3つの グループ化モジュール、すなわち Etemadiらのモジュール、Jacobsの モジュール、Sarkar-Boyerのモジュールを比較・対比する。 パラメータを調整する場合は、Jacobsのモジュールが 拘束ベースの認識において全般の性能が最も良かった。 パラメータを固定すると、the Sarkar-Boyerのモジュールが 認識精度とインデクシングの高速化の観点からベストである。 Etemadiらのモジュールはパラメータを固定しても調整しても 等しく良好な性能を発揮するが、Jacobsのモジュールはパラメータの 選択に対して最も敏感である。 性能全般で順位を付けると、Jacobs、Sarkar-Boyer、Etemadi という順になる。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.19, No.12


文書画像デコーディングのための教師付きテンプレート推定
Supervised Template Estimation for Document Image Decoding

Gary E. Kopec and Mauricio Lomelin

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

Keywords: Document image decoding, Markov models, template estimation, character recognition, document recognition, maximum likelihood.

ページ画像と純粋な複写から、文字テンプレートを教師付き学習する方法が 提案される。 テンプレート学習という問題は、文書画像デコーディングの枠組み内における、 条件付き最尤パラメータ推定の一つとして定式化される。 ここから、3ステップよりなる反復型学習アルゴリズムが導き出される。 これは、複写調整、調整したテンプレートの推定(ATE)、およびチャ ネル推定によって構成される。 最尤ATEという問題は、NP完全であることが示され、それゆえに 近似解法が考案された。 ドキュメントを特化して、技術論文をスキャンしたワシントン大学の UW-IIデータベースを用いることを考える。 この場合の文書デコーディング学習手続きについての評価を述べる。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ジェスチャー表現・認識のための状態ベースのアプローチ
A State-Based Approach to the Representation and Recognition of Gesture

Aaron F. Bobick, Member and Andrew D. Wilson

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

Keywords: Gesture recognition, state-based representation, gesture prototype, motion-based recognition.

ジェスチャー表現・認識のための状態ベースの手法について述べる。 まず、ジェスチャーを、一つの測定・配位空間における状態系列と定義する。 このように定義された状態は、与えられたジェスチャーに対し、 軌跡例の学習集合で立証された反復性と変化性の両方を捉える のに用いられる。 軌跡の全体を代表するプロトタイプ軌跡を計算する方法を用いて、 そのプロトタイプに沿って配位状態を定義する方法、および センサー・データの未分割連続ストリームからジェスチャーを 認識する方法を開発する。 このアプローチは、ジェスチャーに関連する以下のようなセンサー・データ に対する応用により示される。すなわち、 マウス入力装置の2次元の動き、 磁界中での位置・方向センサにより計測された腕の動き、 そして最後に、画像系列から計算された固有ベクトル射影係数の変化である。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


エッジ検出アルゴリズムの相対的性能評価のためのロバスト視覚法
A Robust Visual Method for Assessing the Relative Performance of Edge-Detection Algorithms

Michael D. Heath, Sudeep Sarkar, Thomas Sanocki, and Kevin W. Bowyer

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

Keywords: Experimental comparison of algorithms, edge detector comparison, low level processing, performance evaluation, analysis of variance, human rating.

エッジ検出アルゴリズムを評価するための新しい方法が提案され、 Canny, Nalwa-Binford, Iverson-Zucker, Bergholm, Rothwellによる アルゴリズムについての相対的評価がなされる。 性能の基本的測度は、目視評価によるスコアづけであり、このスコアは 対象物識別に用いられるエッジの知覚品質を示すものである。 この性能測度を用いてエッジ検出アルゴリズムを評価するプロセスには、 以下のものが必要となる。すなわち、 濃淡画像集合の収集、 各アルゴリズムのための入力パラメータの最適化、 目視評価実験、 および統計的分析法の適用 である。 この研究の新しい面とは、エッジ検出器の評価において、 視覚的な作業と複雑なシーンの実画像とを用いていることにある。 定義から見て当然なことであるが、結果はエッジ画像の視覚的評価 と一致するのであり、これがこの方法の魅力的なところである。

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


焦点解析のためのテレセントリック光学系
Telecentric Optics for Focus Analysis

Masahiro Watanabe, Member, IEEE, and Shree K. Nayar, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

焦点合わせの時の光学系の変化により拡大倍率は変化するが、 焦点位置から、あるいは、焦点ずれの位置からの深さによって倍率が変わ るので、これが光学技術上の問題となる。 通常のレンズ系において、解析的に求められた場所に開口を設けることに より、焦点ずれによる拡大倍率が変化しないようにすることができる。 このような光学系の配置が、「テレセントリック」と呼ばれている。 ほとんどの商業用レンズは、このようなテレセントリックにすることがで きることが示される。 テレセントリックレンズであるための付加すべき開口の位置を算出する手 続きと、光学的、および、幾何学的性質の詳細な解析について述べる。 位相に基づくシフト量の検出アルゴリズムを使った実験によって、テレセ ントリックレンズの拡大率不変性が示される。

Ej

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


自由形状オブジェクトのモデル化のための積分的アプローチ
An Integral Approach to Free-Form Object Modeling

Heung-Yeung Shum, Member, IEEE, Martial Hebert, Senior Member, IEEE, Katsushi Ikeuchi, Senior Member, IEEE, and Raj Reddy, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

複数の距離画像を使った自由形状オブジェクトのモデル化のための新しい 手法を示す。 ほとんどの従来型アプローチは、連続する視野像が逐次的に保持されている。 我々は、この逐次的アプローチとは対照的なものとして、積分的アプローチ を提案する。 これは、統計的に最適なオブジェクトモデルを再構成するものであり、 多数の視野像を同時に総計して、重み付き最小二乗法 (WLS)の定式化 に当てはめることでなされる。 この積分的アプローチは、二つの要素からなる。 まず第一に、異なる視野像間の対応付けを成り立たせることを目的として、 グローバルな再サンプリングアルゴリズムにより、個々の視野像から オブジェクトの部分表現を求める。 第二に、重み付き最小二乗法によって、複数視野像の再サンプルされた部 分表現を統合する。 これには部分的に欠損したデータによる主成分分析が使われる。 実験によって、我々の手法がノイズやミスマッチに対して頑健であることが 示される。

Ej

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


決定木生成のための、属性選択と分類の新基準
A New Criterion in Selection and Discretization of Attributes for the Generation of Decision Trees

Byung Hwan Jun, Member, IEEE Computer Society, Chang Soo Kim, Hong-Yeop Song, Member, IEEE, and Jaihie Kim, Member, IEEE Computer Society

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

Keywords: Decision-tree generators, attribute selection, discretization, grouping, gain, gain ratio, normalized gain, entropy.

パターン認識の分野においては、膨大なデータに有効にアクセスするために、 より良い分類が可能な決定木をつくるための属性選択と、分類のより効率的 な基準を作ることは重要である。 これには2つの既知の方法があり、1つはゲイン(収率)、他方はゲイン率 (収率の割合)である。 この2つとも分割したときのエントロピーを基準にしている。 我々は、同じくエントロピーに基づく新たな基準を提案する。 理論的解析とコンピュータシミュレーションによって、本方法が、従来のゲ インやゲイン率よりは優れていることを、多様な状況において実証する。 ここでエントロピー計算の元となる対数の底は、通常の2ではなく、ノード に接続する分岐数(number of successors)である。 理論的解析から、我々の新基準が、常にゲインやゲイン率よりも優れている 特別な状況が存在することが分かった。 また、理論的解析では扱えなかったその他の状況については、シミュレーシ ョンが暗黙的にカバーしているであろう。

Ej

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


エラーに強い木の探索
Error-Tolerant Retrieval of Trees

Kemal Oflazer

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

木をベースとしたデータベースからの検索について述べるが、この木は、与 えられた基本の木から少数の葉が追加されていたり、削除されていたり、あ るいは、葉のラベルが変わっていたりするような小変形木の効率的検索アル ゴリズムについてである。 この応用としては、例文に基づく翻訳システムのマッチング探索や、複雑な 特徴構造を有する語彙データベースからの検索などの自然言語処理がある。 ある場合には何万という木を有するランダムに生成された木状の大データベ ース、および、ウォールストリートジャーナル紙のツリーバンク(treebank) に適用された結果、本アルゴリズムは小さな誤り率で0.1秒から1秒で検索で きる。

Ej

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ストロークに基づくアフィン変換を使った、オンライン手書き漢字認識
On-Line Cursive Kanji Character Recognition Using Stroke-Based Affine Transformation

Toru Wakahara and Kazumi Odaka

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

Keywords: On-line Kanji character recognition, one-to-one stroke correspondence, affine transformation, least-squares criterion, deformation model, distortion-tolerant shape matching.

ストロークに基づく手書き変形をユニフォームなアフィン変換で表現で吸収 する、変形に強いオンライン手書き漢字認識手法を提案する。 楷書体と、草書体の2種類の 2,980種の漢字データベースについて実験し、そ れぞれ、認識率98.4%と96.0%を得た。

Ej

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


変形可能なテンプレートを利用した手書き数字の表現と認識
Representation and Recognition of Handwritten Digits Using Deformable Templates

Anil K. Jain, Fellow, IEEE, and Douglas Zongker

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

Keywords: Digit recognition, deformable template, feature extraction, multidimensional scaling, clustering, nearest neighbor classification.

我々は、変形可能なテンプレートを手書き数字の認識に応用してみた。 2つの文字は、一方の文字の輪郭を変形し、これが他方のエッジ強度に合う割合 をマッチングさせるが、両者の距離は、輪郭の変形の強さ、エッジとの適合度合 い、変形後の内側形状のオーバーラップによって求められた。 最小距離に基づく分類の結果、2000文字の NIST Special Database 1のサブセッ トに対する認識率は最高99.25%であった。 この手法の頑健性を実証するために、別個のテストデータに対して追加実験を行 った。 文字パターンを低次元空間の点として埋め込むため、相違度を距離として利用し 2000×2000の類似度マトリックスに多次元スケール変換がなされた。 上記結果のパターンマトリックスに対して最近接分類法が適用され、再分類され た。 得られた低次元の特徴空間での正解分類率から、低次元の表現空間が存在するこ とが実証できる。 本手法の主要な制約である計算負荷の減少について考察されている。

Ej

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


「曲線のノンパラメトリックな多様な表現へのセグメンテーション」についての コメント
Comments on "Nonparametric Segmentation of Curves Into Various Representations"

Kenichi Kanatani, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

Keywords: Curve segmentation, line fitting, conic fitting, pattern recognition, geometric AIC.

Rosin と Westによる曲線のセグメンテーション問題における理論的な問題点を指摘 するとともに、この解決案を提示する。

Ej

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


金谷への回答
Response to Kanatani

Paul L. Rosin and Geoff A.W. West

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 12, December 1997

Keywords: Curve segmentation, model selection, line, ellipse.

我々は、(1)金谷によって示唆された情報理論的手法やその他の手法、および、(2) 我々の発見的時系列的選択手法について、モデル選択における2通りの手法の利点と 欠点を論じた。

Ej

Copyright (c) 1997 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


[インデックス] [前の年] [次の年]