본문 바로가기

단상/기술

한컴아, 표준이야말로 팔로워의 무기인데...

https://it.chosun.com/news/articleView.html?idxno=2023092143936

포맷은 바꿨지만…AI가 읽기엔 여전히 ‘닫힌 문서’ [HWP 족쇄②]

‘AI 초강국’을 국가 전략으로 내세운 이재명 정부는 최근 5개 컨소시엄 중심의 소버린 AI(국가대표 AI) 정예팀을 선정하고 본격적인 AI 초강국 체제에 박차를 가했다. 하지만 정작 AI를 고도화하

it.chosun.com


오피스 시장에서 마소는 절대강자다. 문서는 당연히 docx고 스프레드 시트는 당연히 xlsx고 프리젠테이션은... 뭐... 아무튼 국내의 기업들 대부분은 ms office를 기본으로 깔고 갈 것이다.

공공만 빼고. 공공만은 우직하게 hwp다.

hwpx도 아니다. 아, 그건 좀...

오픈오피스 진영이 나온지도 꽤 됐고 TeX과 같은 정교한 문서 서식 언어, 마크다운같은 간편한 것도 나와 사실 문세쪽에서 docx는 그렇게 절대적인 것도 아니긴 하다. 특히 마크다운은 그간 고도의 서식화된 문서 위주의 소통을 더 간소한 방식의 문서로 바꾸어 기업의 소통 속도를 더 빠르게 하였다. 그리고 그걸로 만든 문서를 대충 pdf로만 나름 보기 좋은 형태의 문서로 뽑혀나온다. 근데.

왜 공공은 여전히 hwp냐.

오늘은 2가지 측면에서 불평좀 해본다.


먼저 공공. 애초에 문제는 여전히 hwp로 한다는 게 아니다. hwp든 docx든 똑같다. 쓸데없이 서식 많이 들어가면 둘다 AI에서는 제대로 인식되지 않는다. 그리고 대체 왜, 뭐하러 서식이 필요하지? 좀 더 보기 멋지게 되고 그게 그리 중요한가?

AI시대로 가려면 버려야 할 것들이다.

물론 나중에는 달라질 것이다. AI가 좀 더 복잡한 서식도 이해할 것이다. 다량의 데이터들을 가로세로 정리하라고 만든 표를, 문서 테두리 넣고 페이지 메타 넣고 다단 넣으려고 남발해도 이해해줄 것이다. 근데 그게 필요한 서식인가? 그거 만드느라 행정이 느려지는 건 없나? 정작 그러면서 중요한 항목들 구분은 비정형인 경우 허다하다.

예를 들어 문단에 제목을 넣거나 번호 항목을 뽑아도, 인덴트가 서식의 들여쓰기로 들어갈지, 여백로 들어갈지, 번호가 번호 서식으로 들어갈지, 그냥 숫자 쳐서 붙일지, 사람이 보기에 결과는 같을 수 있지만 AI가 보면 전부 다 다르다. 그런데 그런 종류의 서식이 어마어마하게 많다. 그거 절대로 성능 안나온다. 그런데.

예전 데이터들이 그렇게 되어있으니 그냥 거기 맞춰줘?

애초에 만드는 것 부터가 업무여력 낭비인 악습이다. 기업들도 그거 문서 만들고 꾸미고 앉아있느니 일하라고 바뀌고 있다. (물론 그 속도는 매우 느리고 역주행하는 임원들도 천지다... ㅜ.ㅜ) 공공도 바뀌어야한다.

hwp도 docx도 쓰지 말고 마크다운만 써라. 그걸로 보고 못 받을 사람은 잘라야한다.

조직의 리더는 그 조직의 평균적인 구성원들이 별도의 수고를 들이지 않고 정리한 보고서로도 업무 파악이 가능해야한다. 그게 안되는 인간은 그 자리에 있으면 안되며 조직에 해를 끼치는 사람이다.


그리고 한컴.

한컴은 대단했다. 전세계가 마소 제국에 먹히던 와중에 꿋꿋히 국산 워드프로세서를 지켰고 오피스로 확장했다. 훈민정음도 무너지는 와중에 우리나라의 자존심을 지킨 훌륭한 기업이라 생각한다. 하지만 이제는 아집이다.

공공이 한글에 묶여있는 걸 빌미로, 옛날의 영광으로 연명할 뿐인 비참한 몰골이다.

최근 AI트렌드를 따라가려는 모양이지만 그 전까지 한컴이 제대로 트렌드를 따라간 게 없다. 이제는 변화하는 모습을 보여줘야 한다.

폐쇄적인 독자 표준? 그건 애플같은 시장 리더나 하는거고 그마저도 유럽에서 철퇴맞는 일이다. 팔로워는 표준을 무기로 그런 시장 리더들을 압박해야 한다.

기회는 많다. 전통적인 문서 포멧들 외에도 쓰이는 표준들이 어마어마하게 많다. 문서는 TeX과 마크다운이 있다. TeX만 잘 지원해도 논문과 같은 고급 문서 시장에서 다시 주도권을 노려볼 수 있다. 그거 컴파일 환경 세팅하고 컴파일해서 확인하고 하는 거, 어려워하는 사람 많다. HTML과 연계해도 된다. 요즘 간편한 웹 서버 구현 패키지들 많은데 그거랑 연동시키는 것도 방법이다. 마크다운도 강력하다. 옵시디언을 보라. 마크다운으로 만든 문서들을 구조화하는 다양한 기능들이 있다. 잘만 쓰면 어마어마한 문서 풀을 구조화하여 관리할 수도 있다. epub과 연동하여 출판시장을 노릴수도 있다. 일반 문서 epub화하기 생각보다 빡세다더라.

데이터는 json이 대세다. 웹에서도 쓰이고, ai 데이터에도 쓰이고, 데이터 구조화가 필요한 데는 어디서나 다 쓰인다. api 연동도 json이다. 그리고 json이 텍스트기반이라 느리면 arrow도 있다. ms가 간소화된 db 공략한다고 access를 내놓았지만, 글쎄. 상용 DBMS만큼 쓰기 불편한데 DBMS만큼 파워풀하지도 않다. 간단한 로컬데이터 처리엔 엑셀만 못하고 상용서비스로 확장하려면 어차피 갈아타야한다. 그 애매한 영역을 노리는 것도 좋다. LLM데이터 엑셀로 만들면 졸라 버벅이더라... (하지만 엑셀만큼 비전문가도 데이터 보고 만지기 좋은 툴이... ㅜ.ㅜ 물론 고객들은 그거도 보기 힘들다고 징징댄다... 으쯔라고...)

마소 오피스 하는 거 그대로 따라하면 마소 이길 수 있나? 불가능하다. AI쪽 이야기할 때도 말했지만, 이미 시장 지배자가 된 애들이랑 똑같은 기능 만들면, 성능이 더 좋아도 진다. 사람들이 굳이 갈아탈 이유가 없기 때문이다. 거기에 표준까지 안 맞추면 더더욱 안 갈아탄다. 압도적인 고성능을 가져도 쉽지 않다.

애플의 키노트가 간지나는 걸로 유명하다. 하지만 사람들은 갈아타지 않는다. 그거 쓰려면 os도 바꿔야하고, os 바꾸려면 컴도 바꿔야한다. 즉 맥을 사야 키노트를 쓴다. 그럼에도 애플은 할 수 있다. 그래서 일부 사람들이 맥을 사도록 만들 수 있을 정도의 시장 지배력이 있으니까. 근데, 한컴은 그게 가능한가?

불가능하다. 그럼 표준 따라가라.

일단 마소 오피스 표준, 오픈 오피스 표준 100퍼센트 지원하지 않으면, 그리고 그 포멧을 기준으로 하지 않으면 사람들이 쓸 이유가 없다. 그리고 지금같이 공공도 AI넘어가는 상황이면 공공 시장도 언제까지 독점할 수 있을지 모른다.

세금에 빨때 꼽으면 편했지? 이제부턴 난 그럼 당신들의 '적'이 될 거다. 실제로, 라이브러리로 간편하게 변환할 수 있는 다른 포멧들보다 웹서버 형식의 변환기를 설치해야하는 한컴은 AI서비스 구축에 치명적인 장애물이고, 실시간 문서처리에 있어 악재다. 그거 하나만으로 서비스 안정성이 확 떨어진다. 한컴 변환 돌릴 웹서버가 최소 2개 더 필요해지고, 그만큼의 라이선스 비가 들어가고, API연결이 필요하고, 관리 포인트가 늘어난다.

솔직히 한컴이 기준 문서포멧을 docx로 갈아타도 일반에선 아무도 안 쓸 것이다. 내가 볼 땐 마크다운과 json을 기반으로 한, 로컬 사용과 웹과 AI 연동이 가능한 새로운 노트 포멧을 구축하는게 그나마 시도해 볼 수 있는 길이다.

AI하고싶으면 hwp 버려라.