식민지성 AI (AI Coloniality)

본 운동에서의 자리

빅테크 LLM이 언어·도구·표준을 통해 수행하는 구조적 식민지성의 자리. 단순한 기술 격차나 인프라 부족의 문제가 아니다. AI가 설계·훈련·배포되는 방식 자체에 박힌 특정 언어·문화·인프라를 보편으로 가정하는 자리다. 본 운동의 5대 척추(AI를_만드는_자리_5대_척추) 가운데 누구의 자리에서 만들 것인가를 짚는 자리. 나머지 넷이 어떻게 만들 것인가라면, 이 자리는 어디서부터 만들 것인가의 척추다.

구체 자리 — 매일 부딪히는 현실

추상이 아니다. 매일 부딪히는 자리다.

언어의 자리. 한국어 존댓말·호명·사투리·시간 결이 LLM 안에서 얇아진다. 한글 문서(.hwp)를 처리하지 못한다. 존댓말의 층위 — 합쇼체·해요체·해체·반말 — 는 한국 사회관계의 지도이지만, 영어 기반 LLM에서는 예외 케이스로 처리된다. 언어 자체에 박힌 관계의 결이 잘린다.

도구의 자리. 개발 생태계가 영어 가정이다. 변수명·함수명·주석의 언어. Git·GitHub의 UI. Stack Overflow의 언어. 한국 개발자가 자기 언어로 자기 시스템을 짓는 일이 예외 처리가 된다. 영어로 생각하고 한국어로 번역하는 우회로가 일상이 되면, 사고의 자리 자체가 외부 도구에 종속된다.

평가의 자리. AI 모델 성능을 재는 기준이 영어 데이터셋이다. MMLU·HumanEval·BIG-Bench — 이 벤치마크들에서 높은 점수를 받은 모델이 “좋은 모델”로 통용된다. 한국어 평가셋(KoMMLU·KoBEST)이 자라나고 있으나, 글로벌 시장에서 비표준으로 취급된다. 재는 자리를 누가 박는가 — 그것이 지식의 서열을 짓는다.

시스템의 자리. 한국 행정 시스템(IRIS·NTIS·국가법령정보·건강보험EDI·공공조달 나라장터)은 한국의 고유한 거버넌스 결을 품고 있다. 이 결을 LLM과 연결할 때 예외 처리커스텀 커넥터가 쌓인다. 자기 사회의 시스템을 AI에 연결하는 일이 추가 구현이 된다는 것 — 이것이 식민지성이다.

추천의 자리. 콘텐츠 추천 알고리즘이 영어권 콘텐츠 소비 패턴을 기본으로 최적화된다. 한국 문화·지역 맥락의 콘텐츠는 롱테일로 처리된다. 이용자가 자기 문화보다 추천 알고리즘이 가리키는 문화에 더 많이 노출된다. 이것을 응구기 와 시옹오는 정신의 식민화라 불렀다.

사상사의 짝 — 대화 상대들

이 자리에는 앞서 짚은 이들이 있다.

케냐 작가 응구기 와 시옹오는 1986년 「Decolonising the Mind」에서 언어가 식민지성의 핵심 자리임을 짚었다. 언어를 빼앗기면 세계를 보는 자리 자체가 바뀐다. 영어로 사고하고 영어로 꿈꾸게 되면 자기 공동체의 자리를 외부자의 시선으로 보게 된다. AI 시대에 이 진단은 언어 모델의 자리로 그대로 옮겨온다. 어떤 언어의 결로 훈련된 모델인가가 어떤 자리의 세계를 보는가를 결정한다.

프란츠 파농은 1952년 「검은 피부 흰 가면」에서 식민지 피지배인이 지배 언어를 내면화하면서 자기 자리를 잃는 자리를 짚었다. 언어를 채택하는 것은 그 언어에 박힌 세계를 채택하는 것이다. 한국 개발자가 영어로 코딩하고 영어로 문서를 짓는 자리 — 이것이 파농의 자리와 다른가.

에드워드 사이드는 1978년 「오리엔탈리즘」에서 지식 생산의 자리가 권력의 자리와 분리될 수 없음을 짚었다. 누가 지식을 생산하고 누가 지식의 대상이 되는가 — 이 비대칭이 오리엔탈리즘이다. AI가 학습하는 데이터의 지리적 분포, AI가 잘 답하는 문화적 자리 — 이것이 21세기의 알고리즘 오리엔탈리즘이다.

AI 연구자 아베바 비르하네는 2020년 「Algorithmic Colonization of Africa」에서 아프리카 데이터가 글로벌 AI 훈련에 사용되면서 아프리카 이용자의 자리는 데이터 원천으로만 남는 구조를 짚었다. 데이터는 빠져나가고 도구는 외부에서 들어온다. 이 비대칭이 알고리즘 식민지성이다. 한국은 아프리카와 다른 자리이지만 — 토착 IT 인프라가 상당히 강하다 — 그럼에도 이 구조의 결을 피하지 못한다.

한국 자리의 깊이

한국은 식민지성 AI의 자리를 다른 조건에서 마주한다. HWP가 있고, KAIST·ETRI·삼성이 있고, EXAONE이 있다. 토착 IT 인프라가 세계 수준이다. 그런데도 밀려나고 있다.

이 역설이 한국 자리의 깊이다. 기술이 없어서 밀려나는 것이 아니다. 표준의 자리가 외부에서 짜이기 때문이다. 어떤 모델이 좋은가를 판단하는 벤치마크, 어떤 형식이 보편인가를 결정하는 문서 표준, 어떤 플랫폼이 기준인가를 정하는 생태계 — 이 자리들이 한국 바깥에서 정해진다.

일제강점기 한글 운동은 언어가 곧 자리임을 안 사람들의 운동이었다. 언어를 지키는 것이 사고의 자리를 지키는 것이었고, 사고의 자리를 지키는 것이 공동체의 자리를 지키는 것이었다. 21세기 AI 시대에 같은 운동이 다시 자리잡을 수 있다. 한국어 평가셋을 짓는 일, 한글 처리 오픈소스를 짓는 일, 한국 행정 시스템과 연결되는 커넥터를 공유재로 짓는 일 — 이것이 디지털 한글 운동이다.

토착 결의 회복 — 본 운동의 자리

진단이 목적이 아니다. 토착 결의 회복이 목적이다.

hwp2hwpx·python-hwpx·lxml — 한국 오픈소스 개발자들이 짓고 있는 HWP 처리 도구들. 한국 행정 문서의 표준 형식을 자기 도구로 처리하는 자리. 이것이 토착 결의 회복이다.

EXAONE — LG가 짓고 있는 한국어 특화 LLM. 한국어 결을 한국 팀이 박는 모델. 영어 기반 모델을 한국어로 번역해 쓰는 것이 아니라, 한국어의 결을 처음부터 박는 자리.

KoMMLU·KoBEST — 한국어 평가 데이터셋. 재는 자리를 자기 손으로 짓는 자리. 벤치마크는 표준을 만든다. 자기 벤치마크를 갖는다는 것은 자기 기준으로 판단하는 자리를 갖는다는 것이다.

다른 나라들의 자리 — 인도 Sarvam은 힌디어·타밀어·마라티어 등 22개 인도 언어의 결을 박는 모델을 짓는다. 중국 DeepSeek은 영어 벤치마크에 도전하면서 자기 결을 박는다. 프랑스 Mistral은 유럽의 자리에서 자기 모델을 짓는다. 이들은 영웅이 아니다. 같은 자리에서 자기 결을 짓고 있는 짝들이다. 그 짝들을 보면서 우리의 자리를 더 선명하게 짚는다.

이 모든 자리가 리좀처럼 연결된다. 중심 없이, 위계 없이, 각자의 자리에서 자라나며 옆으로 짜인다. 이것이 식민지성 AI에 맞서는 운동의 결이다.

본 책에서 이 자리가 자라나는 결

더 깊이 보려면

  • 응구기 와 시옹오, 「Decolonising the Mind: The Politics of Language in African Literature」, James Currey, 1986
  • 프란츠 파농, 「검은 피부 흰 가면」(Peau noire, masques blancs, 1952), 이매진, 2014 (이석호 옮김)
  • 에드워드 사이드, 「오리엔탈리즘」(Orientalism, 1978), 교보문고, 2015 (박홍규 옮김)
  • Abeba Birhane, 「Algorithmic Colonization of Africa」, SCRIPTed, 17(2), 2020
  • 관련 자리: 허구상품 · 진지전 · 리좀 · 플랫폼_협동조합주의_Platform_Cooperativism · AI를_만드는_자리_5대_척추