Skip to main content

NER 테스트 방법

준비 사항

데이터

  • 추출 대상 개체별로 따로 prompt 준비 필요한지 확인 또는 테스트를 해 보고 확인
  • zero-shot 용 prompt 후보들
  • few-shot 용 prompt 후보들
    - 지시사항 및 예시
  • 테스트용 데이터 : 4천건 살인사건 판례 데이터

테스트 대상 PLM

  • KoBERT/KorBERT 등 BERT 또는 LaMDA, PaLM, Huggingface의 PLM transformer 후보 선택
  • KoGPT 또는 유사 한국어 도메인용 GPT류 선택

테스트 기준

  • 기존 WEX 추출 결과 범죄구성요소 7개 항목 결과와 비교 (수동 비교)
  • 하이퍼파라미터 조정 기준 결과 버전 확보하여 WEX와 비교
  • 향후 범죄도메인특화 사전학습 후에 테스트 및 평가 필요