매일 쏟아지는 AI 정보에 정신없는 나날을 보내고 있습니다.
흐름 따라가기도 벅차네요. ㅜㅜ
오늘은 AI 코딩 에이전트 쪽에 좋은 소식이 하나 들려와서 어떤 일인지 한번 알아보려고 합니다.
ai 코딩 도구의 활용성은 깃헙 코파일럿, 클로드, 커서 ai로 이미 입증이 됐죠.
저도 자주 사용해 보는데, 정말 단시간에 많이 발전했다는 것을 느낍니다.
요즘 구직 사이트에 주니어 개발자 수요가 줄어든 이유도 이 부분이 크지 않을까 생각합니다.
그런데 기존의 ai 코딩 도구들은 코드를 생성해 주는 것에 국한돼 있었습니다.
전체 프로젝트를 파악해서 사용자에 요구에 맞는 코드를 생성하는 것이 아니라 프롬프트에 코드 생성과 관련된 정보를 넣어주면 거기에 맞는 코드를 생성해 내는 식이었죠.
하지만 오늘 말씀드릴 Augment Agent는 조금 다른 것 같습니다.
Augment Agent는 미국의 스타트업인 Augment Code가 개발한 ai 에이전트입니다.
내부적으로 앤트로픽의 클로드와 오픈 AI의 o1이 결합되어 사용된다고 하네요.
Augment Agent는 코드 생성이 아니라 프로젝트 관리에 초점을 맞추고 있습니다.
어떻게 그럴까요?
코드베이스는 소프트웨어를 구성하는 소스코드의 모음을 말합니다.
사람이 생성한 것만요.
코드베이스는 여러 명의 개발자가 오랜 기간 동안 작업한 내용이 들어가기 때문에 수백만에서 수천만 라인의 어마어마 소스코드가 들어가 있습니다.
Augment Agent는 인덱싱을 통해 이 코드베이스 전체를 임베딩해서 구글 클라우드 플랫폼에 요약 정리합니다.
프로젝트와 관련된 모든 내용이 벡터 데이터로 저장되어 언제든 Augment Agent가 활용할 수 있게 되는 거죠.
이제 Augment Agent는 전지적 작가시점에서 코드를 생성할 수 있게 됩니다.
그러니 생성되는 코드의 질이 높아지는 거죠.
어떤 식의 작업이 이루어져야 하는지 상세하게 설명하지 않아도 알 수 있으니까요.
보통 소프트웨어 개발 프로젝트는 비슷한 화면을 조금씩 내용을 바꿔가며 많이 만들어내죠.
Augment Agent에게 데이터베이스 내용이 다른 비슷한 화면을 만들어 달라고 하면 얼마나 빨리 처리되겠습니까?
그래서 요즘 이 친구의 성적이 좋습니다.
SWE-Bench는 AI 코딩 에이전트가 실제 소프트웨어 엔지니어링 문제를 얼마나 잘 풀어내는지 평가하는 벤치마크입니다.
이 벤치마크 중에 SWE-Bench Verified라는 벤치마크는 오픈 AI가 참여하여 인간 검증을 거친 500개의 문제로 평가를 해서 순위를 정하는 벤츠마크입니다.
이 벤치마크에서 Augment Agent가 1위를 차지해 버립니다.
기존에 최고라고 평가받던 클로드 3.7 소넷도 가볍게 제쳐버리고요.
AI 코딩 에이전트의 발전이 워낙 빨라 얼마나 1위를 지켜낼진 모르지만 당분간 Augment Agent를 눈여겨볼 필요는 있는 것 같습니다.
저도 여러 가지 테스트를 진행해보고 있습니다.
기존 코딩 에이전트 보다 나은 점들이 보이는 것 같습니다.
사용을 좀 더 해보고, 자료가 준비되면 포스팅하도록 하겠습니다.
감사합니다.
https://www.youtube.com/watch?v=VqpIT1gTYGc
'AI' 카테고리의 다른 글
구글 All in one 코딩 자동화 도구 Firebase Studio 출시 (0) | 2025.04.21 |
---|---|
오픈 AI 도구를 사용하는 추론 모델(AI 사피엔스?) o3, o4-mini 출시 (0) | 2025.04.17 |
AI 페어 프로그래밍을 꼭 해야하는 이유 (2) | 2024.11.13 |
[30분 완성] chatGPT 만들기(Langchain + streamlit) (0) | 2024.08.28 |
[15분 완성] AI 챗봇 만들기(Streamlit + OpenAI API) - 4) 챗봇 완성!! (0) | 2024.08.26 |