論文

基本情報

氏名 中藤 哲也
氏名(カナ) ナカトウ テツヤ
氏名(英語) NAKATOU TETSUYA
所属 中村学園大学 栄養科学部 栄養科学科
職名 准教授

題名

FETを用いた繰り返しパターン発見手法の提案(パターン抽出)(「夏のデータベースワークショップ(DBWS2003)」一般)

単著・共著の別

著者

中藤 哲也
廣川 左千男

担当区分

概要

半構造テキスト中から自明でない情報を取り出す取り出す技術である,データマイニング,あるいはテキストマイニングは,拡大するWWW上の情報を取り扱う上で非常に重要である.その技術の一つとして,対象のデータに繰り返し出現するパターンを発見する問題がある.発見されたパターンを用いることで,そのデータを加工する,あるいはデータから新たな情報を抽出する事が可能となる.繰り返しパターンを発見する方法として,対象となるデータをそれ自身のコピーと位置をずらして重ね,ー致部分を見つける素朴な方法が考えられる.しかしこの方法は,テキストのサイズnに対して計算量がO(n^2)となり,大きなデータに対しては現実的でない.本研究では,我々が提唱しているFFTを用いた効率的な近似文字列照合アルゴリズムを適用し, O(n log n)の計算量で繰り返しパターンを発見する手法について提案する.

発表雑誌等の名称

電子情報通信学会技術研究報告. DE, データ工学

出版者

社団法人電子情報通信学会

103

191

開始ページ

97

終了ページ

102

発行又は発表の年月

2003/07/10

査読の有無

無し

招待の有無

無し

記述言語

日本語

掲載種別

国際・国内誌

国際共著

ISSN

09135685

eISSN

DOI

Cinii Articles ID

110003174639

Cinii Books ID

Pubmed ID

PubMed Central 記事ID

形式

URL

無償ダウンロード

JGlobalID

arXiv ID

ORCIDのPut Code

DBLP ID