markdown aillm markdownmarkdown futureai eramarkdown programming languagegeo optimization

Markdown이 AI 시대의 프로그래밍 언어가 될까?

Web2MD Team2026-02-2210 min read

Markdown이 AI 시대의 프로그래밍 언어가 될까?

프로그래밍 언어는 인터페이스입니다. 인간이 기계에 의도를 어떻게 표현하는지 정의합니다. 어셈블러는 CPU와 대화했습니다. SQL은 데이터베이스와 대화했습니다. JavaScript는 브라우저와 대화했습니다. 이제 대형 언어 모델이 새로운 종류의 컴퓨팅 기반이 되면서, 물을 가치가 있는 질문이 있습니다: 어떤 언어가 AI와 대화할까요?

답은 이미 존재하는 것, 대부분의 개발자가 무의식적으로 타이핑하는 것일 수 있습니다: Markdown.

효율성 증거

이것은 철학적 논쟁이 아닙니다——측정 가능한 논쟁입니다.

LLM은 텍스트를 토큰으로 처리합니다. 모든 HTML 태그, CSS 클래스 이름, 데이터 속성은 의미에 기여하지 않고 토큰을 소비합니다. 전형적인 3,000단어 기사를 HTML로 렌더링하면 약 8,000 토큰이 될 수 있습니다. 동일한 내용을 Markdown으로: 약 2,800 토큰——65% 감소입니다.

비교:

| 형식 | 토큰 수(3,000단어 기사) | 상대적 비용 | |------|----------------------|-----------| | 원시 HTML | ~8,000 | 1.0× | | 정제된 HTML | ~4,500 | 0.56× | | Markdown | ~2,800 | 0.35× | | 일반 텍스트 | ~2,400 | 0.30× |

Markdown은 정제된 HTML보다 효율적이면서 일반 텍스트가 잃는 의미적 구조를 보존합니다. 헤딩은 모델에게 이것이 섹션 경계임을 알려줍니다. 코드 블록은 모델에게 이것이 산문이 아닌 코드임을 알려줍니다. 목록은 병렬 구조를 전달합니다. 일반 텍스트에는 그것이 없습니다——그냥 단어들일 뿐입니다.

훈련 데이터 정렬

LLM은 형식에 대해 중립적이지 않습니다. 훈련 데이터에 선호도가 새겨져 있습니다.

GPT, Claude, Gemini, Llama의 훈련 코퍼스 모두 엄청난 양의 Markdown을 포함합니다: GitHub README, Stack Overflow 게시물, Reddit 댓글, 문서 사이트, Jupyter 노트북. 이 모델들은 Markdown을 수십억 번 보았습니다. 단순히 파싱하는 것이 아니라——Markdown으로 생각합니다.

Claude나 ChatGPT가 질문에 답할 때 기본으로 어떤 형식을 사용할까요? Markdown. 섹션에는 헤딩. 강조에는 볼드. 열거에는 글머리 목록. 코드에는 코드 블록. 모델들은 Markdown을 기본값으로 사용합니다. 그것이 가장 깊이 훈련된 형식이기 때문입니다.

이것은 피드백 루프를 만듭니다. AI는 Markdown을 가장 잘 읽습니다. AI는 Markdown을 기본으로 작성합니다. AI에 Markdown을 입력하는 사용자는 더 좋은 출력을 얻습니다. 더 많은 Markdown이 생성됩니다. 더 많은 Markdown이 훈련 데이터에 들어갑니다.

GEO 혁명: llm.txt와 의미론적 웹

검색 엔진 최적화(SEO)는 웹사이트가 Google의 크롤러에 발견되어야 했기 때문에 등장했습니다. 새로운 분야——생성 엔진 최적화(GEO)——가 등장하고 있습니다. 웹사이트가 이제 AI 크롤러에 이해되어야 하기 때문입니다.

2024년에 제안된 llm.txt 명세는 웹사이트에 /llm.txt에 콘텐츠, API, 사용 사례, 기능을 요약한 일반 텍스트 Markdown 파일을 게시하도록 요청합니다. 아이디어: 정보를 위해 웹을 크롤링하는 AI 시스템이 이 파일을 읽어 수천 페이지를 파싱하지 않고도 사이트가 무엇인지 이해할 수 있다는 것입니다.

초기 채택자에는 개발자 도구, AI 회사, SaaS 제품이 포함됩니다. 명세는 아직 표준이 아니지만 성장하고 있습니다.

병행 발전: llms-full.txt는 AI 크롤러가 완전한 콘텐츠에 접근하기를 원하는 사이트를 위한 것입니다. AI를 위한 robots.txt라고 생각하세요——접근을 차단하는 대신, 적극적으로 초대하고 안내합니다.

공통점: 모두 Markdown입니다.

중간 계층으로서의 Markdown

컴퓨팅에서 가장 내구성 있는 기술 중 일부는 중간 계층입니다——두 세계 사이를 번역하는 형식. POSIX는 애플리케이션과 운영 체제 사이에 있습니다. HTTP는 클라이언트와 서버 사이에 있습니다. SQL은 애플리케이션과 데이터베이스 사이에 있습니다.

Markdown은 인간의 의도와 기계의 이해 사이의 중간 계층으로서 역할을 찾고 있을 수 있습니다.

체인을 고려해보세요:

  1. 인간이 정보를 쓰거나 찾습니다(산문, HTML, PDF)
  2. 그 정보가 Markdown으로 변환됩니다(Web2MD, Pandoc, 또는 유사 도구를 통해)
  3. Markdown이 AI 모델에 입력됩니다
  4. AI가 Markdown 응답을 생성합니다
  5. 인간이 응답을 읽고, 경우에 따라 다른 형식으로 변환합니다

인간의 의미가 기계 처리를 가로질러 다시 나와야 하는 모든 단계에서 Markdown이 등장합니다.

반론: Markdown으로는 충분하지 않다

Markdown을 전통적인 의미의 프로그래밍 언어라고 부르는 것은 과장입니다. 프로그래밍 언어에는 형식 문법, 타입 시스템, 실행 의미론이 있습니다. Markdown은 의도적인 모호함을 가진 서식 규약입니다.

실제로 나타날 수 있는 것은 구조화된 Markdown——기계 가독 규약으로 보강된 Markdown입니다:

  • YAML 프론트매터 메타데이터용(Jekyll, Hugo, Obsidian에서 이미 표준)
  • Dataview 쿼리(Obsidian 플러그인)은 Markdown 파일을 쿼리 가능한 데이터베이스로 만든다
  • MDX(Markdown + JSX)는 산문에 실행 가능한 컴포넌트를 삽입한다
  • 프롬프트 템플릿은 AI 지시를 위해 {변수}가 포함된 Markdown을 사용한다

궤적은 명확합니다: Markdown은 인간 가독 핵심을 잃지 않고 구조화 능력을 얻고 있습니다.

실용적 결론

Markdown이 어떤 공식적인 의미에서 "프로그래밍 언어"가 되든 아니든, AI 워크플로우에서의 역할은 이미 결정적입니다:

  • LLM 프롬프트의 선호 입력 형식
  • LLM 응답의 선호 출력 형식
  • AI 인덱싱 지식의 저장 형식(Obsidian, Notion, Logseq)
  • 인간-AI 협업의 전송 형식(llm.txt, API 문서)
  • 웹 콘텐츠 변환의 중간 형식(Web2MD, Pandoc)

가장 내구성 있는 컴퓨팅 형식은 단순하고, 인간이 읽을 수 있고, 상호 운용 가능하기 때문에 생존합니다. Markdown은 20년 동안 그 세 가지를 모두 가지고 있었습니다. AI 시대는 Markdown을 위협하는 것이 아니라——정당화하고 있습니다.

AI 워크플로우를 구축하고 있다면, Markdown은 선택 사항이 아닙니다. 기초입니다.


Web2MD는 클릭 한 번으로 모든 웹 페이지를 AI에 최적화된 Markdown으로 변환합니다. 오늘 Markdown 네이티브 AI 워크플로우 구축을 시작하세요.

Related Articles