# 삼성화재

# 원문 텍스트 오추출

#### - 현상

#### <span id="bkmrk-%5Bai_qa%7D-stt%EC%9B%90%EB%AC%B8-%EC%98%A4%EB%A5%98-0">\[AI\_QA} STT원문 오류</span>

<span class="blind">받은날짜 :</span>2023. 3. 27. (월) 17:04

**1.**

**설계번호: 1238676472500107** 간편보험 355·1 유병장수(2204.2)(자동갱신형) 1종(납입면제형)

단위스크립트 : BA0020-001-2(가입동의본인확인)

**STT원문:**

(2023-03-25 14:34:45 **09:15~09:35)**

무배당 간편보험 355- **56232|**유병장수 2204 이 자동 갱신 일종 납입면제형 이 상품에 대해서 가입하시는 부분에 동의하십니까 네 네 본인확인을 위해서 성함하고 생년월일 선생님 여섯자리 다시한번만 말씀부탁드립니다

**STT보기:**

<table id="bkmrk-09%3A15-%7E-09%3A18-%E2%96%B6%EA%B7%B8%EB%A6%AC%EA%B3%A0-%EC%96%B4"><colgroup><col></col></colgroup><tbody><tr><td>09:15 ~ 09:18 ▶그리고 어 부분 어 보 무배당

</td></tr></tbody></table>

<table id="bkmrk-09%3A19-%7E-09%3A21-%E2%96%B6%EA%B0%84%ED%8E%B8%EB%B3%B4%ED%97%98%C2%A0"><colgroup><col></col></colgroup><tbody><tr><td>09:19 ~ 09:21 ▶간편보험 **355-1**

</td></tr></tbody></table>

<table id="bkmrk-09%3A21-%7E-09%3A22-%E2%96%B6%EC%9C%A0%EB%B3%91%EC%9E%A5%EC%88%98"><colgroup><col></col></colgroup><tbody><tr><td>09:21 ~ 09:22 ▶유병장수

</td></tr></tbody></table>

<table id="bkmrk-09%3A22-%7E-09%3A23%C2%A0%E2%96%B62204-"><colgroup><col></col></colgroup><tbody><tr><td>09:22 ~ 09:23 ▶2204 이

</td></tr></tbody></table>

<table id="bkmrk-09%3A23-%7E-09%3A27-%E2%96%B6%EC%9E%90%EB%8F%99-%EA%B0%B1%EC%8B%A0"><colgroup><col></col></colgroup><tbody><tr><td>09:23 ~ 09:27 ▶자동 갱신 일종 납입면제형 이 상품에 대해서

</td></tr></tbody></table>

<table id="bkmrk-09%3A27-%7E-09%3A29-%E2%96%B6%EA%B0%80%EC%9E%85%ED%95%98%EC%8B%9C%EB%8A%94"><colgroup><col></col></colgroup><tbody><tr><td>09:27 ~ 09:29 ▶가입하시는 부분에 동의하십니까

</td></tr></tbody></table>

<table id="bkmrk-09%3A29-%7E-09%3A30-%E2%96%B6%EB%84%A4-%EB%84%A4"><colgroup><col></col></colgroup><tbody><tr><td>09:29 ~ 09:30 ▶네 네

</td></tr></tbody></table>

#### - 현황파악

timestemp를 추출하는 정규표현식이 공백을 포함하여 추출을 하게 되어있었는데 STT 본문에 숫자+타임스템프가 나오는 경우가 발생하여 timeteamp를 잘못 잘라 내 원문을 잘못 return함

timestemp : \[\\|\\x20\](\\d{1,8}\[\\|\\x20\]){2}

예문 : 간편보험 355-<span style="background-color: rgb(241, 196, 15);">1 1|12344|</span>15533|유병장수

위의 노란색부분을 오검출

#### - 조치내용

timestemp에서 공백에 해당하는 \\x20을 제거

timestemp : \\|(\\d{1,8}\\|){2}

위와 같이 변경

# 기타 문제점

삼성화재 분석실패 현상   
\- 현상 : 신규 등록 된 상품을 분석요청하면 TA 분석중이라는 메시지에서 안넘어감  
\- 원인 : QA에 DB 컬럼중 특정 컬럼 값의 length가 1인데 실제 데이터는 3으로 넘어와서 DB insert 중 에러발생  
\- 조치내용 : QA 쪽 문제여서 조치 한 내용 X

  
삼성화재 신규 PK컬럼 추가 개발  
\- 담보 관련하여 키가 중복되어 들어오는 경우가 있어 구별을 위한 컬럼을 추가 요청 받아 신규 컬럼 추가 후 작동 테스트   
\- 컬럼명 : cust\_cd

  
삼성화재 키워드 옵션 미추출  
\- 현상 : 키워드 추출 중 (키워드)? 와 같이 옵션으로 되어 있는 키워드를 추출하지 못하는 경우가 발생  
\- 원인 : keyword에 숫자나 영문자가 들어가는 경우 한글로 변환하는 함수에서 특수문자를 제거하는 부분이 존재  
\- 조치내용 : 키워드가 ?로 끝나는 경우 특수문자를 제거하는 부분을 수행하지 않도록 변경