codex를 활용한 업무 자동화(4)

1년여 전, 일본에서 출간된 Dify 기반 AX 관련 서적을 읽다가 흥미로운 사례를 하나 접했다.

“명함 관리를 Dify로 자동화한다.”

아이디어 자체는 충분히 매력적이었다. 다만 몇 가지 중요한 부분이 빠져 있었다.

명함 이미지는 어떤 방식으로 AI에 전달하는가
처리된 결과는 어디에 저장되고, 어떻게 확인하는가

책에서는 명함 이미지를 업로드한다고만 설명되어 있었을 뿐, 실제로 어떤 흐름으로 데이터를 넣고, 결과를 어떻게 활용하는지에 대해서는 구체적인 설명이 없었다. 결국 이 사례는 ‘가능성’ 수준에서만 제시된 느낌이었다.

그러다 얼마 전 Threads에서 흥미로운 글을 하나 보게 되었다.

Gemini Pro를 이용한 명함정리

내용은 생각보다 단순했다. 명함을 촬영한 영상을 그대로 업로드하면, AI가 이를 읽어 엑셀 형태로 정리해 준다는 것이었다. 직관적인 접근이었다. 괜히 복잡하게 설계할 필요 없이, 입력을 한 번에 넘기고 결과를 구조화하면 되는 문제였다.

그래서 문득 이런 생각이 들었다.

“이걸 Codex로도 할 수 있을까?”

직접 시도해 보니, 결과는 예상보다 괜찮았다. 사용한 프롬프트는 아래와 같다.

영상에 등장하는 모든 명함의 정보를 확인하고, 아래 항목에 맞춰 스프레드시트에 정리하세요. 
[정리 항목] :  회사명 / 이름 / 직급 / 부서 / 휴대전화번호 / 이메일 / 주소(우편번호 포함) / 회사전화번호 
[작성 규칙] : 
- 명함 1장당 1행으로 정리합니다. 
- 영상에서 확인이 어렵거나 해당 항목이 없는 경우 빈 칸으로 남깁니다. 
- 전화번호는 하이픈(-)을 포함하여 표기합니다. (예: 010-1234-5678) 
- 주소와 우편번호는 하나의 셀에 함께 기재합니다. (예: 서울시 강남구 테헤란로 123 (06130))

아직 100장 이상 규모로 테스트해 보지는 못했지만, 컨퍼런스 등에서 받은 수십 장 정도의 명함은 무리 없이 처리할 수 있었다.

다만 입력 데이터의 규모가 커질수록 처리 성능이나 안정성은 별도의 고려가 필요해 보인다. 이 경우에는 Threads에서 소개된 것처럼 Gemini Pro 기반 접근이 더 적합할 수도 있겠다.