[디지털데일리 이종현기자] 국회도서관 인공지능(AI) 의정분석 서비스 ‘아르고스’에 대한 법률 데이터셋 구축이 완료됐다. 국회 및 공공 관련 법규 등 법률 관련 질의에 대한 대화형 문단이 가능해진 상황이다.
15일 AI 기업 무하유는 국회도서관 융복합서비스 데이터셋 구축사업을 완료했다고 밝혔다. 아르고스에 법률 관련 Q&A 데이터셋을 구축해 법률 관련 질의사항에 대화형 문답으로 답변할 수 있도록 이용자 편의성을 높였다.
무하유는 사업 추진을 위해 법률 지식을 보유한 전문가들을 포함한 데이터셋 구축인력을 구성했다. 법률에 관련 이슈 키워드와 제개정일·의안·회의록·주요 사건 및 인물에 대한 정보를 비롯해 통계표의 제목 및 매칭 키워드 등 영역을 포함했다.
HWP와 PDF 파일 내 법률 관련 통계표 또는 이미지의 제목 및 매칭 키워드 데이터도 구축했다. 표 및 이미지 데이터 구축은 무하유의 표절검사 서비스 내에 적용된 이미지 인식 및 추출 기술을 활용해 자동으로 해당 데이터를 추출한 후 다차원의 품질 검수를 실시하는 식으로 이뤄졌다.
데이터셋 구축에는 무하유의 데이터 관리 플랫폼 ‘데이터팩토리’가 활용됐다. 데이터팩토리는 AI 적용 솔루션을 운영하는 과정에서 필요한 데이터를 자체 구축한 후 정제 및 가공한다. 인력소싱, 계약, 데이터 구축, 품질관리, 저작권 관리 등까지 수행한다.
무하유의 신동호 대표는 “무하유는 기술로 공정의 효율화를 높이고, 인력으로 데이터의 품질을 높이는 방식의 데이터셋 구축 전략을 취하고 있다. 앞으로 검증된 AI 기술에 기반한 데이터셋 제작 역량으로 공공 분야 진출에 박차를 가할 것”이라고 말했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
다시 제기된 'SKT IMEI 유출' 우려…웹셸이 해커 통로됐나(종합)
2025-05-19 16:56:53국회 과방위 “해킹사태, 정부 조사결과 신뢰 어려워…SKT에 배상책임 물을 것”
2025-05-19 16:54:42SKT 해킹, 웹셸서 비롯됐나…“임시서버 보안조치 강화하겠다”
2025-05-19 15:32:33SKT “추가 정보유출, 확인된 바 없다”…2차피해 발생 시 100% 책임
2025-05-19 15:05:22정부 “SKT, IMEI 유출 가능성 있지만…복제폰 생성은 불가”
2025-05-19 13:57:12SKT 해킹서 IMEI 포함된 서버 감염 확인…"유출 여부는 확인 안돼"
2025-05-19 11:09:50[DD퇴근길] 쿠팡 따라잡기? 배민, '티빙 결합상품' 내놓는다
2025-05-19 17:13:45"슈퍼 SON 한 번 더"…쿠팡플레이 시리즈, '토트넘 핫스퍼' 온다
2025-05-19 16:20:55"오리지널이 효자네"…'샤크: 더 스톰', 티빙 유료가입기여자 수 1위
2025-05-19 16:20:37넷마블 '세븐나이츠 리버스', 출시 5일 만에 양대마켓 매출 1위 달성
2025-05-19 16:15:58펄어비스, '붉은사막' 엔비디아 최신 기술 DLSS 4 적용
2025-05-19 15:31:17