論文

基本情報

氏名 中藤 哲也
氏名(カナ) ナカトウ テツヤ
氏名(英語) NAKATOU TETSUYA
所属 中村学園大学 栄養科学部 栄養科学科
職名 准教授

題名

FFTを用いた繰り返しパターン発見手法の提案(セッション5B : パターン抽出) 

単著・共著の別

著者

中藤 哲也
広川 佐千男

担当区分

概要

半構造テキスト中から自明でない情報を取り出す技術である,データマイニング,あるいはテキストマイニングは,拡大するWWW上の情報を取り扱う上で非常に重要である.その技術の一つとして,対象のデータに繰り返し出現するパターンを発見する問題がある.発見されたパターンを用いることで,そのデータを加工する,あるいはデータから新たな情報を抽出する事が可能となる.繰り返しパターンを発見する方法として,対象となるデータをそれ自身のコピーと位置をずらして重ね,一致部分を見つける素朴な方法が考えられる.しかしこの方法は,テキストサイズnに対して計算量がO(n2)となり,大きなデータに対しては現実的ではない.本研究では,我々が提唱しているFFTを用いた効率的な近似文字列照合アルゴリズムを適用し,O(nlogn)の計算量で繰り返しパターンを発見する手法について提案する.

発表雑誌等の名称

情報処理学会研究報告. データベース・システム研究会報告

出版者

情報処理学会

2003

71

開始ページ

311

終了ページ

318

発行又は発表の年月

2003/07/16

査読の有無

無し

招待の有無

無し

記述言語

日本語

掲載種別

国際・国内誌

国際共著

ISSN

09196072

eISSN

DOI

Cinii Articles ID

110002911214

Cinii Books ID

Pubmed ID

PubMed Central 記事ID

形式

無償ダウンロード

JGlobalID

arXiv ID

ORCIDのPut Code

DBLP ID