언어와 도구의 식민지성 — 토착 결의 회복

1. 매일 부딪히는 자리

이건 추상이 아니다.

한글 문서(.hwp)를 열어달라고 하면 LLM은 할 수 없다고 말한다. 영어로 써 달라고 하면 더 잘 쓰고, 한국어로 써 달라고 하면 어딘가 얇아진다. 한국 공공조달 시스템(나라장터)이나 연구비 관리 시스템(IRIS)과 연결하려면 추가 구현이 필요하다고 한다. 한국 건강보험 EDI와 AI를 이으려면 별도의 커넥터를 짜야 한다. 국가법령정보 API를 LLM에 붙이려면 이걸 직접 만드셔야 합니다라는 말이 돌아온다.

개발 환경 자체도 그렇다. 변수명을 한국어로 쓰면 불편한 일들이 생긴다. Git 커밋 메시지는 영어로 쓰는 관행이 있다. Stack Overflow의 답변은 영어다. 프레임워크 공식 문서는 영어고, 에러 메시지도 영어다. 한국 개발자가 자기 일을 한국어로 사고하고 기록하는 것이 예외 처리가 되어 있다.

이것이 지금 우리가 매일 부딪히는 자리다.

기술 격차의 문제가 아니다. 어떤 언어·도구·표준을 *기본값(default)*으로 설정하느냐의 문제다. 그리고 그 기본값을 누가 정하느냐의 문제다.

2. 진단 — 기술이 아니라 식민지성이다

앞서(1편) 슈마허의 물음을 짚었다 — 기술이 누구의 손에 있고, 누구의 맥락에서 작동하는가. 앞서(8편) 비대칭의 자리를 짚었다 — 빅테크 개발자는 운동담론의 어휘를 배우지 않는다. 이 두 자리가 9편에서 하나로 만난다.

빅테크 LLM의 한국어 처리 미흡은 개발이 덜 된 자리가 아니다. 그들의 설계 자리에서 한국어는 추가 지원 언어이고, 영어는 기본 언어다. 한국 행정 시스템은 엣지 케이스이고, 미국·EU 행정 시스템은 기본 케이스다. 어떤 벤치마크로 모델 성능을 재는가 — MMLU·HumanEval은 표준이고 KoMMLU·KoBEST는 지역화다. 이 모든 자리에서 영어와 영어권 시스템이 보편으로, 다른 모든 언어와 시스템이 특수로 자리매김된다.

이것이 언어·도구·표준의 식민지성이다.

케냐 작가 응구기 와 시옹오가 1986년 「Decolonising the Mind」에서 짚은 것이 이 자리다. 언어를 빼앗기면 세계를 보는 방식 자체가 바뀐다고 그는 짚었다. 영어로 사고하고 영어로 꿈꾸게 되면, 자기 공동체를 외부자의 언어로 보게 된다. AI 시대에 이 진단은 언어 모델의 자리로 그대로 옮겨온다. 어떤 언어의 결로 훈련된 모델인가가 어떤 자리의 세계를 보는가를 결정한다.

프란츠 파농은 「검은 피부 흰 가면」(1952)에서 지배 언어를 내면화하는 자리를 짚었다. 언어를 채택하는 것은 그 언어에 박힌 세계를 채택하는 것이다. 에드워드 사이드는 「오리엔탈리즘」(1978)에서 지식 생산의 자리가 권력의 자리와 분리될 수 없음을 짚었다. 누가 지식을 생산하고 누가 그 대상이 되는가의 비대칭 — 21세기 AI에서는 알고리즘 오리엔탈리즘으로 자라난다. 어떤 문화·맥락이 학습 데이터에서 두껍고 어떤 문화·맥락이 얇은가가 곧 AI가 보는 세계의 두께를 결정한다.

아베바 비르하네는 2020년 「Algorithmic Colonization of Africa」에서 이 구조를 더 직접적으로 짚었다. 아프리카의 데이터는 빠져나가고 도구는 외부에서 들어온다. 데이터를 낸 공동체가 그 데이터로 만들어진 AI의 혜택을 받는 것이 아니라, 데이터의 원천으로만 남는 구조.

한국은 아프리카와 다른 자리다. 토착 IT 인프라가 상당히 강하다. 그런데도 같은 구조의 결이 자라난다. 이것이 한국 자리의 깊이다.

3. 한국 자리의 역설 — 강한데도 밀려나는

한국의 기술 역량은 약하지 않다. KAIST·ETRI·POSTECH이 있고, 삼성·SK·LG가 있으며, 한국 개발자들의 역량이 세계 수준이다. HWP라는 자기 문서 표준이 있고, IRIS·NTIS라는 정교한 행정 시스템이 있다. 한국 인터넷 인프라는 세계 최고 수준이다. 그런데도 빅테크 LLM 앞에서 추가 구현을 요구받는다.

기술이 없어서 밀려나는 것이 아니다. 표준의 자리가 외부에서 정해지기 때문이다.

어떤 모델이 좋은 모델인가 — 그 기준을 누가 박는가. AI 모델의 성능을 재는 벤치마크 MMLU는 미국 대학원 입시를 참조해 만들어졌다. HumanEval은 영어 코딩 문제다. 이 기준들에서 높은 점수를 받은 모델이 좋은 모델로 통용된다. 한국어 이해, 한국 법률 해석, 한국 행정 문서 처리 능력은 이 기준들 안에 들어오지 않는다.

어떤 형식이 문서 표준인가 — 그 결정에 한국이 얼마나 개입하는가. PDF·DOCX·Markdown이 글로벌 표준으로 자리잡으면서 HWP는 비표준으로 취급된다. HWP는 한국 행정 문서의 오랜 형식이지만, 글로벌 AI 생태계에서는 처리 어려운 예외 케이스가 된다.

어떤 언어가 보편인가 — 이 기본 가정 자체가 박혀 있다. 한국어 존댓말의 층위 — 합쇼체·해요체·해체·반말 — 는 한국 사회관계의 지도다. 누구에게 어떤 말씨를 쓰는가가 관계의 결을 짓는다. 이 결이 LLM 안에서 얇아질 때, AI는 한국 사회관계를 외국인 수준으로 처리한다.

이 역설 — 강한데도 밀려나는 자리 — 이 1편의 슈마허 물음과 직접 이어진다. 기술이 누구의 손에 있는가뿐 아니라 기술의 기준이 누구의 자리에서 박히는가. 자기 기술을 갖되 자기 기준을 잃은 자리. 이것이 21세기 식민지성의 새로운 자리다.

4. 1·2·3·4편과 다른 자리

1편이 짚은 것은 어떤 AI를 만들 것인가였다. 슈마허의 적정기술 논리로. 2편은 어떻게 만들 것인가를 짚었다. DIY·수리권·도구 민주화의 계보로. 3편은 어디에 자리 잡을 것인가를 짚었다. 빅테크 옆 자율 영역 운동으로. 4편은 누구의 도구를 빌릴 것인가를 짚었다. 거버넌스를 보는 윤리로.

9편이 짚는 것은 다르다.

어떻게, 어디서, 어떤 도구로가 아니라 — 누구의 자리에서.

1~8편이 AI를 만드는 방식의 자리라면, 9편은 AI를 만드는 자리의 자리다. 이 물음이 가장 앞에 박혀야 할 것 같지만, 마지막에 박히는 이유가 있다. 이 물음은 앞의 여덟 편이 쌓인 후에야 선명해지는 자리이기 때문이다. 적정기술의 논리를, DIY의 계보를, 자율 영역의 자리를 짚은 후에야 — 그 모든 자리가 어디에서 자라나야 하는가의 물음이 자라난다.

그래서 이 편은 1부의 마지막이다.

이 편은 다음으로 이어진다. 1부의 진단과 선언을 받아, 다리 단에서 자기 자리에서 자라나기의 결로 넘어가고, 2부에서 어떤 자리의 영역 전략인가가 자라난다.

5. 토착 결의 회복 — 운동의 자리

진단이 목적이 아니다.

HWP 처리를 가능하게 하는 한국 오픈소스들이 자라나고 있다. hwp2hwpx, python-hwpx, lxml을 조합해 .hwp 파일을 처리하는 파이프라인 — 이것이 한국 개발자들이 자기 행정 문서를 자기 도구로 처리하는 자리다. 이것이 토착 결의 회복이다.

LG AI 연구원이 자라나고 있는 EXAONE은 한국어 결을 한국 팀이 박는 모델이다. 영어 기반 모델을 한국어로 번역해 쓰는 것이 아니라, 한국어의 결 — 존댓말의 층위, 한국 문화의 맥락, 한국 법률의 언어 — 을 처음부터 설계하는 자리. 이것이 토착 결의 회복이다.

한국어 평가 데이터셋(KoMMLU·KoBEST)을 짓는 연구자들이 있다. 재는 자리를 자기 손으로 짓는다는 것은 자기 기준으로 판단하는 자리를 갖는다는 것이다. 벤치마크를 짓는 자가 표준을 짓는다. 이것이 토착 결의 회복이다.

이 운동은 혼자가 아니다. 리좀처럼 다른 나라들에서도 같은 자리가 자라나고 있다. 인도의 Sarvam은 힌디어·타밀어·마라티어 등 22개 인도 언어의 결을 박는 모델을 짓는다. 프랑스의 Mistral은 유럽의 자리에서 자기 모델을 짓는다. 중국의 DeepSeek은 자기 결을 박는다. 이들이 영웅인 것이 아니다. 각자의 자리에서 자기 결을 짓고 있는 짝들이다. 그 짝들의 자리를 보면서 우리의 자리를 더 선명하게 짚는다.

한국 자리의 깊이는 거기에 있다. 강한 토착 인프라가 있기 때문에 더 선명하게 세울 수 있다. HWP가 있고, 한국 행정 시스템이 있고, 한국어의 결이 있다. 이것들이 비표준의 짐이 아니라 자기 자리의 자산이 되는 방향으로 운동이 자라난다.

6. 일제하 한글 운동의 21세기 변주

100년 전 운동을 되돌아보는 것이 이상한 일이 아니다.

일제강점기 한글 운동은 언어가 곧 자리임을 안 사람들의 운동이었다. 언어를 지키는 것이 사고의 자리를 지키는 것이었고, 사고의 자리를 지키는 것이 공동체의 자리를 지키는 것이었다. 언어가 단순한 의사소통 도구가 아니라 자기 세계를 보는 자리 자체임을 그들은 알았다.

21세기에 같은 물음이 자라난다. AI 시대에 어떤 언어로 훈련된 모델이 우리 사회의 인공 판단자가 되는가. 어떤 벤치마크로 재는 모델이 좋은 모델로 통용되는가. 어떤 도구의 생태계 안에서 우리의 개발자들이 자라나는가. 이 물음들이 100년 전의 물음과 같은 자리에서 자라난다.

디지털 한글 운동이라는 이름이 너무 거창하다면, 더 작은 이름으로 부를 수 있다. 한국어 평가셋을 짓는 일. HWP 처리 오픈소스를 공유재로 만드는 일. 한국 행정 시스템 커넥터를 함께 짓는 일. 한국어 존댓말의 결을 LLM 안에 제대로 짜는 일. 이 작은 자리들이 모여 자기 언어와 도구의 자리를 지키는 운동이 된다.

8편에서 짚은 그람시의 진지전이 여기서도 자라난다. 진지전은 자기 위치를 짓는 결이다. 표준의 자리에서 싸우는 것 — 벤치마크를 짓고, 평가 기준을 박고, 도구의 공유재를 짓는 일 — 이 기동전보다 오래 걸리지만 자리가 된다.

7. 결미 — 누구의 자리에서

1부의 처음에서 우리는 슈마허의 물음으로 시작했다 — 기술이 누구의 손에 있는가. 그 물음을 1~8편에 걸쳐 짚어왔다. 적정기술로, DIY로, 자율 영역으로, 도구 선택의 윤리로, 노동의 자리로, 권리의 자리로, 지능 무산자의 진단으로, 새 어휘의 정초로.

9편에서 그 물음이 한 자리 더 깊어진다.

누구의 손에만이 아니라 — 누구의 자리에서.

한국어로 사고하는 자리에서. 한국의 행정 결을 아는 자리에서. 조합원 관계의 맥락이 박힌 자리에서. 농민의 암묵지가 자라난 자리에서. 이 자리들이 기본값이 되는 AI — 이것이 연대지능 혁명이 세우고자 하는 AI의 자리다.

기술적 탁월함이 목적이 아니다. 자기 자리에서 자라난 AI. 자기 언어와 도구의 결을 아는 AI. 자기 공동체의 판단을 돕되 그 판단을 대체하지 않는 AI. 이것이 1부를 마치며 박는 자리다.

다리 단으로 넘어가기 전에, 이 한 문장을 남긴다:

토착 결의 회복은 닫힘이 아니다. 자기 자리를 가져야 다른 자리와 대등하게 만날 수 있다.

식민지성 AI 비판이 어느 역사적 결 위에서 자라났는지 — 슈마허에서 이반 일리치, 아베바 비르하네까지 70년의 계보 — 는 AI_운동사_지능을_무엇으로_보았는가에 짚여 있다.

품앗이 위키

탐색기

언어와 도구의 식민지성 — 토착 결의 회복

언어와 도구의 식민지성 — 토착 결의 회복

1. 매일 부딪히는 자리

2. 진단 — 기술이 아니라 식민지성이다

3. 한국 자리의 역설 — 강한데도 밀려나는

4. 1·2·3·4편과 다른 자리

5. 토착 결의 회복 — 운동의 자리

6. 일제하 한글 운동의 21세기 변주

7. 결미 — 누구의 자리에서

그래프 뷰

목차

백링크