애플이 사파리에 AI 에이전트용 서버를 붙였다 — 브라우저가 AI 손아귀에 들어오는 방식
7월 첫째 주에 애플과 구글이 나란히 같은 방향의 발표를 냈다. 애플은 7월 1일 Safari Technology Preview 247에 “Safari MCP 서버"를 넣었고, 같은 시기 구글 크롬 팀의 chrome-devtools-mcp는 GitHub 트렌딩에 오르며 4만 5천 스타를 넘겼다. 두 진영이 각자의 브라우저에 AI 에이전트가 페이지를 직접 조작·검사할 수 있는 창구를 하나씩 낸 것이다. 여기서 등장하는 MCP(Model Context Protocol, Anthropic이 2024년 말 공개한 오픈 표준. AI 모델이 외부 도구·데이터에 접근하도록 도구 카탈로그를 서버 형태로 노출하는 프로토콜)는 원래 파일 시스템·데이터베이스·API 같은 백엔드 자원을 대상으로 시작했다. 이번엔 그 서버 대상이 브라우저 그 자체로 옮겨왔다. 사용자가 보고 있는 웹 페이지, 열려 있는 탭, 방금 발생한 네트워크 요청 — 이런 라이브 상태를 AI에게 전부 넘기는 구조다. ...
Z.AI ZCode 등장 — GLM팀이 코딩 에이전트 시장에 들어오다
터미널이나 IDE 안에서 개발자 대신 코드를 읽고 고치고 실행까지 해주는 프로그램을 “코딩 에이전트"라고 부른다. 대표적으로 Anthropic이 만든 Claude Code(클로드 코드, 터미널에서 돌아가는 AI 코딩 비서)와 OpenAI가 만든 Codex CLI가 있다. 지난 6월 30일 여기에 세 번째 주자가 합류했다. 중국 Z.AI(구 Zhipu AI, 오픈 가중치 LLM 시리즈인 GLM을 만드는 칭화대 출신 회사)가 자체 코딩 에이전트인 ZCode를 공개한 것이다. 커뮤니티 반응이 뜨거워 Hacker News 상위권에 하루 이상 걸려 있다. 무엇이 나왔나 ZCode는 GUI(그래픽 인터페이스) 데스크톱 앱이다. macOS·Windows·Linux 3종을 하루에 같이 냈다. Claude Code처럼 순수 CLI(터미널 명령어 기반)는 아니고, 겉모습은 OpenAI Codex의 데스크톱 UI에 더 가깝다. HN 댓글에서는 “손 아이콘, 텍스트 입력창 사용법, 사이드바 스타일이 Codex와 1:1로 똑같다"는 지적이 나왔다. ...
Claude Sonnet 5 — Opus 4.8에 근접한 중간 모델의 의미
Anthropic이 2026년 6월 30일 Claude Sonnet 5(클로드 소넷 5, Anthropic의 중간급 LLM)를 공개했다. Anthropic의 모델은 보통 3개 라인으로 나뉜다 — Haiku(작고 빠른 모델), Sonnet(균형형 중간 모델), Opus(최상위 모델). 이번 발표의 핵심은 새 Sonnet의 성능이 같은 회사의 최상위 모델인 Opus 4.8에 근접했다는 점이다. 같은 가격대(중간급)는 그대로 두고 능력만 끌어올린 것이라, “어느 티어를 골라야 하나"라는 사용자 결정 자체를 흔드는 변화다. 성능: Opus 4.8을 따라잡았다는 주장 Anthropic의 공식 발표문은 두 가지 agentic 벤치마크를 콕 집어 언급했다. ...
1년 안에 내 일 대부분을 AI가 한다 — Anthropic 설문 응답자 35%
“내 일 1년 안에 AI가 대신할까?” 직장인이라면 한 번쯤 자문해 본 질문이다. Anthropic이 2026년 6월 26일 공개한 Economic Index June 2026 리포트가 이 질문에 직접 답한다. Claude(앤트로픽이 만든 대형 언어 모델 챗봇 — 한국에서도 SK텔레콤 협력 등으로 인지도가 빠르게 올라간 모델) 사용자 약 9,700명을 설문한 결과, **3명 중 1명 이상(35%+)이 “12개월 안에 AI가 내 업무 대부분 또는 거의 전부를 처리할 수 있을 것”**이라고 답했다. 작년만 해도 같은 질문에 “5년 뒤"라고 답하던 사람이 다수였다. 1년 만에 “5년” → “1년"으로 인식이 압축된 셈이다. ...
한 모델이 여러 모델을 부린다 — Sakana Fugu가 GPT-5.5를 SWE-Bench에서 넘은 방식
식당 주방에는 보통 셰프 한 명이 한 요리를 끝까지 책임진다. 그런데 일부 호텔 주방은 다르다. 한 명이 야채를 썰고, 다른 한 명이 굽고, 또 다른 한 명이 마지막에 맛을 본다. 누구를 어디에 배치할지 결정하는 사람도 따로 있다. 결과적으로 한 사람이 다 하는 것보다 빠르고 안정적이다. 도쿄 스타트업 Sakana AI가 6월 27일 공개한 Fugu가 그런 호텔 주방 방식을 AI에 적용했다. 사용자는 API 호출 한 번을 보내지만, 뒤에서는 여러 모델이 역할을 나눠 일한다. 그리고 코드 작성 벤치마크 SWE-Bench Pro(실제 GitHub 이슈를 모델이 풀게 시키고 단위 테스트로 채점하는 평가)에서 GPT-5.5보다 25% 가까이 높은 점수를 받았다. 이게 지금 핫한 이유는 Anthropic 수출 금지 2주 만의 첫 비미국 frontier 대안 모델이기 때문이다. ...
GPT-5.6 Sol — 미국 정부가 사용자를 골라 받는 첫 AI
특정 신약은 처방전이 있어야 살 수 있다. 너무 강하거나 오남용 위험이 크기 때문이다. 이번 주 출시된 AI 모델 하나가 비슷한 처지가 됐다. OpenAI가 차세대 모델 GPT-5.6 Sol을 6월 26일 공개했는데, 미국 정부 사전 심사를 통과한 “신뢰할 수 있는 파트너"만 우선 사용할 수 있다. 트럼프 행정부의 요청이었다. 상용 AI 모델 사용자를 정부가 직접 골라 받는 게이트키핑은 처음이다. 작년까지 AI 규제는 모델 자체 안전 평가(레드팀, 시스템 카드 공개)에 집중돼 있었지, 누가 쓸 수 있는지를 행정부가 사전에 정하는 단계로 가지 않았다. ...
ChatGPT 좌, Grok 우, Gemini 중앙 — AI 챗봇의 정치 편향을 측정한 두 보고서
AI 챗봇에게 “최저임금을 더 올려야 할까"라고 물으면 어떤 답이 돌아올까. 같은 질문이라도 ChatGPT, Claude, Gemini, Grok, Llama, DeepSeek 여섯 모델은 조금씩 다른 답을 한다. 6월 같은 주에 발표된 워싱턴포스트와 trakkr.ai의 두 보고서가 그 차이를 숫자로 측정했다. 핵심 발견은 두 가지다. 대부분 모델이 좌측으로 기울어 있고, Gemini만 거의 한가운데, Grok이 가장 오른쪽이다. 그리고 흥미롭게도 모델이 스스로 “나는 중립"이라고 말할 때, 실제 측정값은 그 주장과 크게 다르다. 두 보고서가 본 같은 풍경 trakkr.ai는 6월 중순 6개 모델에 정치적 질문 묶음을 던져 4,400개 답변을 모으고, 응답을 “경제 좌-우 축"과 “사회 자유-권위 축” 위에 점으로 찍었다. 핵심 수치(경제 축, −1 완전 좌에서 +1 완전 우 사이로 정규화): ...
OpenAI도 자체 칩으로 — Jalapeño 발표로 완성된 빅4 NVIDIA 탈피
AI 모델을 돌리려면 그래픽 카드(GPU)가 필요하다. 사람의 뇌가 신호를 동시에 수십억 군데 전달해야 하는 일을 컴퓨터로 흉내 내려면 평범한 CPU 한 개로는 한참 모자라고, 작은 계산을 수천 개씩 동시에 처리하는 GPU가 있어야 한다. 그 GPU 시장의 95% 이상을 차지하는 회사가 NVIDIA다. ChatGPT를 한 번 돌릴 때마다 OpenAI는 NVIDIA에 돈을 낸다. 그 구도가 어제(2026-06-24) 한 단계 흔들렸다. OpenAI가 자기 손으로 설계한 첫 칩 **Jalapeño(할라피뇨)**를 발표했다. 제조 파트너는 Broadcom. 학습용이 아니라 추론(inference) 전용 칩이고, 회사 표현으로는 “현존하는 최고 수준 칩 대비 와트당 성능이 훨씬 좋다"고 한다(TechCrunch). 구체적인 숫자는 아직 공개되지 않았고, 칩은 테스트 단계다. ...
앤트로픽 'Claude Tag' 공개 — 슬랙에서 @Claude를 부르면 팀 동료처럼 일한다
업무 메신저 채널 한 곳에 새 동료가 들어왔다. 누구든 @로 호명하면 일이 떨어지고, 그 사람이 답변을 던지면 채널의 모두가 그 진행 상황을 본다. 다른 채팅창을 따로 열 필요도, 같은 맥락을 매번 다시 설명할 필요도 없다. Anthropic이 2026-06-23 공개한 Claude Tag는 이 그림을 그대로 슬랙에 옮긴 제품이다. 지금까지 Claude를 슬랙에서 쓰려면 1:1 다이렉트 메시지 또는 “Claude in Slack” 앱 형태가 일반적이었다. Claude Tag는 그 구도를 바꿔서 채널 안의 멤버로 Claude를 합류시킨다. 채널 누구든 @Claude를 태그하면, Claude는 그 채널에 묶인 도구·데이터·코드베이스에 접근해 작업을 쪼개 처리한 뒤 스레드로 결과를 돌려준다. ...
OpenAI Codex가 21일 동안 37TB를 쓴 이유 — SQLite 로깅 폭주 버그
코딩 에이전트는 백그라운드에서 무엇을 쓰고 있는지 사용자가 거의 모른다. 그 사각지대를 정면으로 들춰낸 GitHub 이슈가 6월 14일에 올라왔고, 8일 뒤인 6월 22일에 패치됐다. OpenAI 공식 Codex CLI(터미널에서 LLM에게 코드 작업을 시키는 OpenAI의 공식 도구) 사용자가 평소처럼 켜둔 사이에 로컬 SSD에 21일간 37TB가 기록됐다. 추정 연간 약 640TB. 소비자용 SSD의 보증 수명(TBW, ‘Terabytes Written’이라 부르는 메이커가 명시한 누적 쓰기량 한계)이 1TB짜리 기준 대체로 600TB 안팎이라, 1년이면 SSD 한 개를 통째로 다 깎는다. ...