[데모]

· DANCHU ☞DANCHU 소개 pdf 다운로드

· Word_space_detector ☞Test page

· Dependency_parser ☞DP_Github

· Named_entity_recognizer ☞NER_Github



[관련연구 설명]

· DANCHU

Bidirectional LSTM CRFs를 사용하여 개발한 한국어 POS, NER, DP, SRL 입니다. 데모는 시스템 부하로 인해 올리지 않겠습니다. 관심있으신 분들은 연락해주시길 바랍니다.

· Word_space_detector

기존에 대용량 사전을 사용하는 논문들과는 달리 음절이 가지는 확률 정보에 기반한 띄어쓰기 프로그램입니다. 경량화에 초점을 맞추었기 때문에 확률정보만을 기반으로 하였고, 1MB 남짓한 용량으로 94%이상의 성능을 나타내었습니다.

· Noun_extractor

문서를 대표하는 색인어인 명사를 추출하기 위하여 연구되었던 많은 방법중에서, 언어 분석도구를 사용하지 않고 한국어 명사의 출현 특성과 적용 규칙을 이용하여 제작한 경량화된 명사 추출기입니다. 146 KB의 사전 용량으로 0.86의 F1-measure 값을 나타내었습니다.

· Dependency_parser

의존 구문 분석(Dependency Parsing)은 자연어 문장의 구조적 관계를 파악하는 언어 분석의 한 단계입니다. 문장 안의 모든 어절은 의존소, 지배소가 되며, 의존소와 지배소 쌍은 하나의 의존 관계명으로 정의할 수 있습니다. 의존 관계 및 의존 관계명을 잘 부착하는 것은 문장의 의미적, 구조적 중의성을 해결할 수 있으며, 잘 분석된 의존 구문 분석은 많은 자연어 처리 연구에서 중요한 자질로 사용되고 있습니다.

· Named_entity_recognizer

개체명 인식(Named-Entity Recognition)이란 정보 추출의 부과업으로 문서에서 개체명(Named-Entity)을 찾아 추출하고, 인명, 기관명, 지명, 시간 표현, 날짜 표현 등의 미리 정의된 고유한 범주로 분류하는 과정입니다.



[참여한 대표 프로젝트]

· April 2017 ~ December 2019
  Co-Principal Investigator (Co-PI) involved in"기계학습용 텍스트 데이터 레이블 자동생성 및 검증도구 개발.
  (Development of Automatic Text Data Labeling and Verification Tools for Machine Learning)."
  Supported by 정보통신/방송 기술개발사업, 미래창조과학부 (Ministry of Science, ICT and Future Planning) .
  (IS lab. Dong-A University)

· April 2016 ~ December 2016
  Co-Principal Investigator (Co-PI) involved in"의학정보 질의응답시스템 개발을 위한 의학용어 개체명(ME: Medical Entity)   인식 기술 및 문장 임베딩 기술 개발 (Development of Medical Entity Recognition and Sentence Embedding Techniques for Medical Information Retrieval)."
  Supported by LG Electronics.
  (IS lab. Dong-A University)


[데모]

· Sentiment_classification_sys ☞Test page

· Question_Classification in CQA_sys ☞Test page

· Question_Retrieval in CQA_sys ☞Test page



[관련연구 설명]

· Sentiment_classification_sys

한국어 문서의 감정(긍정 혹은 부정)을 분석하는 시스템 입니다.

· ChatBot

음성이나 문자를 통한 인간과의 대화를 통해서 특정한 작업을 수행하도록 제작된 컴퓨터 프로그램입니다.

· Question_Classification in CQA_sys

이 시스템은 사용자가 입력한 질문을 네이버의 지식iN에 정의된 범주로 분류하는 시스템입니다.
This system is to classify user’s input questions into predefined target categories in the Naver KIN.

· Question_Retrieval in CQA_sys

이 시스템은 사용자가 입력한 질문과 유사한 네이버의 지식iN에서 있는 질문-응답 쌍을 검색하는 시스템입니다.
This system is to find relevant question-answer pairs for user’s input questions.

· Entity Linking

개체 링킹은 입력된 질의에 존재하는 개체를 표현한 개체 표현(entity mention)을 지식베이스에 존재하는 개체와 연결하여 의미를 파악하는 연구입니다.

· Task oriented Dialogue System

인간의 언어 그대로인 자연어(natural language)를 이용하여 기계와 소통하는 시스템을 의미합니다.

· Speech-act

화행(Speech-act)이란 화자의 발화를 통해 나타나는 화자의 의도를 말하며 화행 분석(Speech-act Analysis)이란 주어진 발화에 대해 화행을 결정하는 것을 말합니다. 최근 사용자의 발화를 이해하고 피드백을 줄 수 있는 대화 시스템의 중요성이 나날이 증가하고 있습니다. 이러한 대화 시스템은 사용자의 의도를 정확히 이해하고 그에 맞는 응답을 생성할 수 있어야 합니다. 따라서 사용자의 의도를 파악하기 위한 화행 분석은 대화 시스템의 필수 요소라고 할 수 있습니다.

· Slot filling

Slot Filling이란 화자의 발화에서 유용한 정보를 추출하기위해 각 도메인에 맞게 미리 정의한 Slot과 그에 맞는 Value를 찾는 것을 말합니다.

· Dialogue Management

대화 관리는 대화의 흐름을 고려하여 사용자 발화에 대답할 알맞은 시스템 발화를 찾는 것이다. 규칙 기반 대화 관리(rule-based dialogue management) 방법과 예제 기반 대화 관리(example-based dialogue management) 방법, 심층학습 기반 대화 관리(deep learning based dialogue management) 방법 등이 있습니다.



[참여한 대표 프로젝트]

· May 2018 ~ November 2018
  Co-Principal Investigator (Co-PI) involved in"전문분야 문답 담화 분석을 위한 구어체 질문의 슬롯 필링 기술 개발   (Development of the Slot Filling Technique for the discourse analysis of question-answers in specialized field)."
  Supported by 한국전자통신연구원 (ETRI).
  (IS lab. Dong-A University)

· November 2015 ~ October 2018
  Co-Principal Investigator (Co-PI) involved in"유사도 측정 기법을 이용한 FAQ 시스템 개발 (Development of a FAQ   System Using Similarity Measure Methods)."
  Supported by 현대자동차 (Hyundai Motors, Co.).
  (IS lab. Dong-A University)

· November 2015 ~ October 2018
  Principal Investigator (PI) involved in "딥러닝 기술을 이용한 커뮤니티 질문-응답 서비스 기반의 질문 분류, 검색 및 응답
  추천 시스템 구축 (Development of Query Classification, Retrieval and Answer Recommendation Systems for the   cQA Service Using Deep Learning Techniques)"
  Supported by 기본연구지원사업, 한국연구재단 (National Research Foundation of Korea (NRF))
  (IS lab. Dong-A University)

· June 2017 ~ November 2017
  Principal Investigator (PI) involved in"전문분야 문답담화 분석을 위한 구어체 질문의 화행분류 연구
  (Speech-act analysis of colloquial questions for the discourse analysis of question-answers in specialized field). "
  Supported by ExoBrain Project, 한국전자통신연구소 (ETRI) .
  (IS lab. Dong-A University)

· May 2016 ~ January 2017
  Principal Investigator (PI) involved in"WiseWordNet 확장을 위한 사전 Entity Linking 연구
  (Entity Linking for Expanding WiseWordNet)."
  Supported by 한국전자통신연구소 (ETRI).
  (IS lab. Dong-A University)


[데모]

· Information_Retrieval_sys☞Test page



[관련연구 설명]

· Information_Retrieval_sys

대법원에서 공개한 주요판결문 15,000여개를 대상으로, 형태소분석기와 아파치 루씬을 이용하여 문서색인 및 검색을 합니다.

· Clustering and Summarization

군집화는 주어진 데이터들의 특성을 고려해 데이터 집단(클러스터)을 정의하고 데이터 집단의 대표할 수 있는 대표점을 찾는 것으로 데이터 마이닝의 한 방법이며 요약은 원본 텍스트에서 선별된 중요단어들을 포함시키며 줄이는 방법입니다.



[참여한 대표 프로젝트]

· May 2018 ~ October 2018
  Co-Principal Investigator (Co-PI) involved in"이슈 중심의 다중 뉴스 문서 군집화 및 요약 기술 연구 개발
  (Development of the Clustering and Summarization Technique for News Multi-Documents by Focusing on Issues)."
  Supported by 한국과학기술정보연구원 (KISTI) .
  (IS lab. Dong-A University)

· July 2015 ~ December 2015.
  Co-Principal Investigator (Co-PI) involved in"의학정보 복문 지식검색 기술 개발
  (Development of a Complex Sentence Based Knowledge Retrieval Technology for Medical Information Retrieval)."
  Supported by LG Electronics.
  (IS lab. Dong-A University)




[관련연구 설명]

· NMT

NMT(Neural Machine Translation)는 인공 신경망 기계번역을 뜻합니다.