共同研究・競争的資金等の研究課題

基本情報

氏名 中藤 哲也
氏名(カナ) ナカトウ テツヤ
氏名(英語) NAKATOU TETSUYA
所属 中村学園大学 栄養科学部 栄養科学科
職名 准教授

タイトル

大量実テキストデータに潜む少量多品種な部分構造の統計的発見と利用に関する研究

提供機関

文部科学省

制度名

科学研究費補助金(挑戦的萌芽研究)

研究機関

九州大学

研究期間(From)

2009

研究期間(To)

2011

担当区分

連携研究者

担当研究者

池田大輔
中藤哲也
山田泰寛

研究種目

挑戦的萌芽研究

形式

URL

研究概要

本研究の目的は、与えられたデータの多くに対して成立する知識ではなく、相対的に少ない部分データに対して成立する粒度の細いパターンを発見する手法を構築することである。そのために、その着想となった2つの研究を「パターン発見への写像導入」と「パターン発見への距離空間導入」という観点で捉えなおす。「パターン発見への写像導入」に対し、本年度は主に以下の3つの成果が得られた。(1) 近似文字列照合を行う乱択アルゴリズムの最適な写像の生成方法の提案(2) 最適な写像により生成された写像の精度に関して、既存手法との実験的な評価(3) 近似文字列照合を行う乱択アルゴリズムについて、従来高速フーリエ返還(FFT)を用いていた部分に実数値FFTを用いることによる高速化これらの成果は、従来から研究してきた写像による近似文字列照合の拡張であり、厳密には一致していないパターンの高速発見に役に立つ。「パターン発見への距離空間導入」に対し、本年度は主に以下の2つの成果が得られた。(1) 背景集合を用いた例外的なテキストパターン発見手法の提案(2) 提案手法と既存の例外的な指標(Zスコア)との実験的な比較これらの成果は背景集合との距離によりパターンを発見しようとする本研究の目的に合致したものであり、従来手法では得られなかったパターンを発見できることを示したものである。一方で、前者の「パターン発見への写像導入」で...

資金種別

競争的資金

国際共著