codex를 활용한 업무 자동화(4)
[Codex
AX
]
1년여 전, 일본에서 출간된 Dify 기반 AX 관련 서적을 읽다가 흥미로운 사례를 하나 접했다.
“명함 관리를 Dify로 자동화한다.”
아이디어 자체는 충분히 매력적이었다. 다만 몇 가지 중요한 부분이 빠져 있었다.
- 명함 이미지는 어떤 방식으로 AI에 전달하는가
- 처리된 결과는 어디에 저장되고, 어떻게 확인하는가
책에서는 명함 이미지를 업로드한다고만 설명되어 있었을 뿐, 실제로 어떤 흐름으로 데이터를 넣고, 결과를 어떻게 활용하는지에 대해서는 구체적인 설명이 없었다. 결국 이 사례는 ‘가능성’ 수준에서만 제시된 느낌이었다.
그러다 얼마 전 Threads에서 흥미로운 글을 하나 보게 되었다.
내용은 생각보다 단순했다. 명함을 촬영한 영상을 그대로 업로드하면, AI가 이를 읽어 엑셀 형태로 정리해 준다는 것이었다. 직관적인 접근이었다. 괜히 복잡하게 설계할 필요 없이, 입력을 한 번에 넘기고 결과를 구조화하면 되는 문제였다.
그래서 문득 이런 생각이 들었다.
“이걸 Codex로도 할 수 있을까?”
직접 시도해 보니, 결과는 예상보다 괜찮았다. 사용한 프롬프트는 아래와 같다.
영상에 등장하는 모든 명함의 정보를 확인하고, 아래 항목에 맞춰 스프레드시트에 정리하세요.
[정리 항목] : 회사명 / 이름 / 직급 / 부서 / 휴대전화번호 / 이메일 / 주소(우편번호 포함) / 회사전화번호
[작성 규칙] :
- 명함 1장당 1행으로 정리합니다.
- 영상에서 확인이 어렵거나 해당 항목이 없는 경우 빈 칸으로 남깁니다.
- 전화번호는 하이픈(-)을 포함하여 표기합니다. (예: 010-1234-5678)
- 주소와 우편번호는 하나의 셀에 함께 기재합니다. (예: 서울시 강남구 테헤란로 123 (06130))
아직 100장 이상 규모로 테스트해 보지는 못했지만, 컨퍼런스 등에서 받은 수십 장 정도의 명함은 무리 없이 처리할 수 있었다.
다만 입력 데이터의 규모가 커질수록 처리 성능이나 안정성은 별도의 고려가 필요해 보인다. 이 경우에는 Threads에서 소개된 것처럼 Gemini Pro 기반 접근이 더 적합할 수도 있겠다.