하네스 엔지니어링

요즘 하네스에 대한 생각

이번 글은 잘 정리된 글은 아니다. 딱히 정보성 글이라고 보기도 어렵다. 다만 요즘 머릿속을 맴도는 생각을 그냥 한 번 꺼내보고 싶었다. 앞으로도 이런 식의 글을 조금 더 자주 쓰게 될 것 같다.

요즘 AI 엔지니어링 쪽에서 하네스(Harness) 엔지니어링이라는 단어가 빠르게 퍼지고 있다. OpenAI나 Anthropic 쪽 공식 블로그에서도 이 표현을 언급하면서, 에이전트의 작업 성능을 어떻게 측정하고 개선할 것인지 이야기한다. 그런 흐름을 보고 있으면 하네스라는 개념이 분명 중요해지고 있다는 것은 느껴진다.

(하네스란, AI가 더 안정적이고 예측 가능하게 일하도록 입력, 도구 호출, 실행 절차, 검증 과정을 묶어 둔 운영 구조를 말한다. )

그런데 이상하게도,하네스에 대한 설명은 추상적인 설명에 가까운 경우가 많다. 오히려 그 반대에 가깝다. 사람들은 하네스를 이야기하지만, 막상 그것이 정확히 무엇인지에 대해서는 쉽게 감이 오지 않는다. 설명을 찾아봐도 비슷하다. 실제로 무엇을 만들었고 어떻게 적용했는지보다는, 왜 필요하고 어떤 의미를 가지는지 같은 추상적인 이야기가 앞서는 경우가 많다. 그래서 하네스가 궁금했던 사람, 특히 직접 적용해보고 싶은 사람에게는 명쾌함 보다는 물음표만 더 남는 것 같기도 하다.

지금의 하네스는 어떤 구체적인 실체가 많이 누락되어 있다. 내가 느끼기에는 그렇다. 하네스가 중요하다는 공감대는 충분히 형성되었지만 정작 그 실체는 아직 흐릿한 상태에 더 가깝다.

누군가 나에게 하네스가 뭐냐고 묻는다면, 나는 아마 이렇게 말할 것 같다. 하네스는 아직 하나의 정해진 방법론이 아니다. 그것은 누군가에게는 실행 절차일 수 있고, 누군가에게는 평가 루프일 수 있고, 또 누군가에게는 에이전트를 다루는 전체 시스템일 수 있다. 같은 단어를 쓰고 있지만, 각자가 떠올리는 대상은 조금씩 다를 가능성이 크다.

어쩌면 그래서 더 자주 혼란스러워지는지도 모르겠다. 하네스를 이야기하는 사람들은 분명 각자의 노하우를 갖고 있다. 다만 그것이 전부 드러나지는 않는다. 그런데 또 한편에서는 “사실 여러분도 이미 하네스를 하고 있었던 것”이라는 말도 나온다. 이 말이 아주 틀렸다고 생각하지는 않는다. 많은 사람들이 이미 프롬프트를 정리하고, 절차를 나누고, 결과를 검증하고, 반복 실험을 하면서 비슷한 일을 해왔기 때문이다.

하지만 그 말은 묘하게 사람을 안심시키면서도 동시에 더 헷갈리게 만든다. 이미 하고 있었다고 말하는 순간, 오히려 다시 궁금해진다. 그렇다면 대체 지금 사람들이 새롭게 말하는 하네스는 무엇이 다른가.

나도 처음에는 비슷하게 생각했다. 내가 하던 방식과 뭐가 다른지, 혹시 내가 놓치고 있는 특별한 절차나 구조가 있는지 궁금했다. 어떤 보고 체계나 자동화 패턴, 혹은 더 정교한 프레임이 있는 건가 싶기도 했다. 그런데 적어도 지금까지 내가 느낀 것은, 아직 “이것이 바로 하네스다”라고 말할 만한 단단한 실체는 없다는 것이다.

중요한 것은 도구가 아니라 목적

그래서 나는 하네스를 그 실체를 파헤치기보다는 하네스가 등장한 배경을 이해하는 편이 더 맞다고 느낀다. AI를 활용하고, 에이전트를 활용해 시스템을 만들다 보면 누구나 비슷한 문제를 만난다. 복잡한 일을 좀 더 잘 처리하게 만들고 싶고, 결과를 더 예측 가능하게 만들고 싶고, 이상한 방향으로 새지 않게 만들고 싶고, 가능하면 더 안전하게 운영하고 싶어진다. 사람들은 이런 문제를 풀기 위해 저마다의 방식을 만들어왔고, 그러다 어느 순간 하나의 이름 아래 묶이기 시작한 것이 아닐까 싶다.

그런 점에서 하네스의 본질은 특정 도구에 있지 않은 것 같다. **스킬, MCP, 플러그인, 서브에이전트, Claude Code 사용법 ** 같은 것들은 분명 중요하다. 이런 것들을 잘 알면 더 좋은 시스템을 만들 가능성도 커진다. 하지만 그것 자체가 하네스는 아니다. 좋은 도구를 안다고 해서 곧바로 좋은 하네스를 가지게 되는 것은 아니다. 반대로 특별한 도구가 없더라도, 절차와 검증과 실험 방식이 잘 정리되어 있으면 충분히 좋은 하네스라고 부를 만한 구조가 생길 수도 있다.

결국 중요한 것은 무엇을 쓰느냐보다 무엇을 만들어내느냐에 더 가깝다. 하네스는 어떤 거대한 제품 이름일 수도 없고, 하나의 정답 공식일 수도 없다. 그것은 어떤 시스템일 수도 있고, 어떤 스크립트의 묶음일 수도 있고, 그냥 반복적으로 사용하는 절차의 집합일 수도 있다. 그래서 나는 하네스를 배워야 할 단일한 대상이라기보다, 직접 다뤄보면서 만들어가는 운영 감각에 더 가깝게 느낀다.

**결국 직접 해보는 것의 중요성

이렇게 쓰고 보니 나 역시 조금 추상적인 이야기를 하고 있는 것 같기는 하다. 다만 지금 이 시점에서는 그게 오히려 솔직한 태도에 가깝다고 생각한다. 아직은 이름이 먼저 퍼지고 있고, 그 안에 들어갈 공통된 형식은 천천히 드러나는 중인 것 같다. 앞으로는 좋은 하네스를 공개하는 사람들도 더 많아질 것이고, 그 과정에서 베스트 프랙티스처럼 불릴 수 있는 것들도 조금씩 쌓일 것이다.

그 사이에 내가 할 수 있는 것은 결국 두 가지인 것 같다. 하나는 관련된 정보와 사례를 계속 빠르게 따라가는 것. 그리고 더 중요한 다른 하나는, 직접 해보고 실험하면서 내 문제에 맞는 워크플로우를 만들어가는 것이다.

새로운 정보는 계속 올라온다. 하지만 어떤 정보가 정말 유용한지, 왜 그것이 중요한지, 실제로 어떤 맥락에서 힘을 가지는지는 결국 직접 부딪혀보기 전에는 잘 와닿지 않는다. 어떤 문제를 내 손으로 겪어본 다음에야, 다른 사람이 왜 그런 구조를 만들었는지 비로소 이해되는 순간이 있다. 그런 의미에서 직접 해본다는 것은 단순히 따라 해보는 일이 아니라, 문제를 자기 것으로 만드는 과정에 가까운 것 같다.

안타깝게도 모든 것을 다 직접 해볼 수는 없다. 시간에는 한계가 있다. 그래서 나도 몇 가지는 직접 깊게 관여하면서 만들고, 나머지는 얕더라도 계속 눈여겨보는 방식으로 가고 있다. 완전히 모르지는 않되, 모든 것을 다 붙잡으려고도 하지 않는 식이다. 그리고 그 와중에도 내가 하고 있는 실험에 무엇을 적용할 수 있을지 계속 생각해본다.

요즘 하고 있는것

요즘은 사이드 프로젝트로 AI 기반 선물 추천 서비스를 만들면서 여러 전략들을 실험해보고 있다. OpenClaw로 글쓰기나 리서치, 코딩 같은 작업 자동화를 시도해보고 있다. 개발와 관련해서는, 신규프로젝트와 레거시프로젝트를 병행하고 있다. 레거시 프로젝트를 AI 에이전트에 맞게 리팩토링도하는 작업을 해보고 있다. 아마 지금의 내게 하네스란, 누군가가 정의해준 하나의 정답이라기보다 이런 실험들 속에서 조금씩 손에 익어가는 방식에 더 가까운 것 같다.