로그인 회원가입 고객센터
레포트자기소개서방송통신서식공모전취업정보
campusplus
세일즈코너배너
자료등록배너

웹 기반의 언어자원 객체화에 근거한 사전 개발 시스템


카테고리 : 레포트 > 사회과학계열
파일이름 :.hwp
문서분량 : 13 page 등록인 : CPIA_noxknoker
문서뷰어 : 한글뷰어프로그램 등록/수정일 : 07.05.50 / 09.12.29
구매평가 : 다운로드수 : 0
판매가격 : 2,400

미리보기

같은분야 연관자료
보고서설명
통합정보사전 웹 기반의 언어자원 언어자원 객체화 / [1] 영남대학교, “심층 국어정보처리 품질관리 체계”, 한국과학기술원, 대용량 국어정보 심층처리 및 품질관리기술 개발 최종보고서, pp.56-68, 1998.
[2] 이재성 외3, “텍스트 및 전자사전 관리시스템의 설계”, 한국정보과학회 & 한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.408-414, 1996.
[3] 한국과학기술원, “텍스트코퍼스 및 전자사전 관리시스템(TDMS)”, 과학기술처, 통합 국어정보베이스 최종보고서, pp.17-150, 1996.
[4] 최병진 외3, “표준화를 위한 일반사전의 논리 구조”, 한국정보과학회&한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.415-423, 1996.
[5] 황도삼 외2, “자연언어처리”, 홍릉과학출판사, 1998.
[6] 황도삼 외2, “자연언어이해”, 홍릉과학출판사, 1999.
[7] 최용준, 황도삼, 최기선, “YDK : 한국어 통합정보사전 개발시스템의 설계 및 구현”, 한국정보과학회, 한국정보과학회 추계학술발표회논문집, 1998년 10월.
[8] 최용준, 황도삼, 최기선, “YDK-Term : 한국어용언의 다국어 통합정보사전”, 한국인지과학회&한국정보과학
본문일부/목차
1. 서론

2. 한국어 통합정보사전 개발 시스템
2.1 TDMS
2.2 인터넷을 기반으로 한 분산 언어자원 통합 모델
2.3 YDK1

3. 웹 기반의 언어자원 객체화 모델
3.1 웹 기반의 언어자원 객체화
3.2 언어자원 객체화 모듈
3.3 익스트라넷(Extranet)

4. YDK2000의 설계 및 구현
4.1 YDK2000의 설계
4.2 YDK2000의 구현
4.3 사전간의 자료교환 지원 환경
4.4 결과 및 고찰

5. 결론 본 논문에서는 각기 다른 장소에 다양한 형태로 분산되어 있는 여러가지 언어자원들을 웹 기반에서 객체화시키는 모델을 제안한다. 웹 기반에서 객체화된 언어자원들은 다양한 응용 시스템 개발에 간단한 방법으로 이용되어 강력한 자연언어처리 응용 시스템을 구성할 수 있다. 또한, 초기 개발 이후에 이루어진 각 언어자원들의 개량은 별도의 처리과정 없이 자동으로 각 응용 시스템에 반영되므로 효과적인 유지보수가 가능하다는 장점이 있다. 제안한 모델의 적합성을 검증하기 위해 사전 개발 시스템 YDK2000를 설계하고 구현하였다. 개발한 YDK2000은 기존의 각종 사전의 여러가지 사전정보를 통합할 수 있을 뿐 아니라 여러 자연언어처리 시스템들과의 인터넷 접속을 통해 언어처리를 위한 사전정보를 손쉽게 통합할 수 있어 고품질의 사전을 개발할 수 있다.
자연언어처리 시스템들은 대개 많은 양의 문법정보, 의미정보, 용례 등을 필요로 한다. 이러한 정보는 전자사전을 통해 제공되며, 제공되는 정보의 양과 질에 따라 프로그램의 성능도 영향을 많이 받는다[1].
전자사전을 구축하는 일은 노동집약적이면서도 전문지식을 필요로 하기 때문에 개발과정이 길고, 개발한 사전은 지속적으로 단어가 추가될 뿐만 아니라, 때로는 사전의 구조 자체도 변경되게 된다. 이러한 전자사전을 기반으로 하여 개발되는 자연언어처리 시스템들은 사전의 변화에 영향을 받게 되며, 필요로 하는 전자사전들을 시스템 내에 모두 설치해두어야 하는 문제점들을 갖고 있다[1-3]. 뿐만 아니라. 응용 시스템이 다른 자연언어처리 시스템들의 처리결과를 이용하고자 할 경우에는 별도의 복잡한 재개발과정을 거쳐 시스템 내에 그 시스템을 포함시켜 두어야만 한다. 이러한 과정을 거쳐 개발된다 하더라도 실제로 사용하기 위해서는 매우 큰 저장 공간과 고성능의 시스템이 필요하므로 여러 면에서 비효율적이다. CORBA는 복잡한 재개발과정을 없애주는 특징이 있어 많이 이용되지만 별도의 미들웨어를 설치해야하며, 사용이 어렵다는 단점이 있다.
본 논문에서는 인터넷의 기본 서비스인 웹(World Wide Web) 환경에서 분산된 언어자원들을 객체화시키는 방법을 제안한다. 웹 기반에서 객체화된 언어자원들은 다양한 응용 시스템 개발에 간단한 방법으로 이용되어 강력한 자연언어처리 응용 시스템을 구성할 수 있다. 제안한 모델의 적합성을 검증하기 위해 한국어 통합정보사전 개발시스템(YDK2000이라 부름.)을 설계하고 구현하였다. YDK2000은 기존의 각종 사전의 다양한 사전정보를 통합할 수 있을 뿐만 아니라, 여러 자연언어처리 시스템들과 인터넷 접속을 통해 언어처리를 위한 사전정보를 손쉽게 통합할 수 있어 고품질의 전자사전을 개발할 수 있는 자연언어처리 응용 시스템이다.
연관검색어
통합정보사전 웹 기반의 언어자원 언어자원 객체화

구매평가

구매평가 기록이 없습니다
보상규정 및 환불정책
· 해피레포트는 다운로드 받은 파일에 문제가 있을 경우(손상된 파일/설명과 다른자료/중복자료 등) 1주일이내 환불요청 시
환불(재충전) 해드립니다.  (단, 단순 변심 및 실수로 인한 환불은 되지 않습니다.)
· 파일이 열리지 않거나 브라우저 오류로 인해 다운이 되지 않으면 고객센터로 문의바랍니다.
· 다운로드 받은 파일은 참고자료로 이용하셔야 하며,자료의 활용에 대한 모든 책임은 다운로드 받은 회원님에게 있습니다.

저작권안내

보고서 내용중의 의견 및 입장은 당사와 무관하며, 그 내용의 진위여부도 당사는 보증하지 않습니다.
보고서의 저작권 및 모든 법적 책임은 등록인에게 있으며, 무단전재 및 재배포를 금합니다.
저작권 문제 발생시 원저작권자의 입장에서 해결해드리고 있습니다. 저작권침해신고 바로가기

 

ϰڷٷΰ thinkuniv ķ۽÷