Simon Willison’s Weblog
The Claude C Compiler: What It Reveals About the Future of Software
- Nicholas Carlini từ Anthropic viết về dự án sử dụng parallel Claudes để xây dựng một C compiler dựa trên Opus 4.6.
- Chris Lattner, chuyên gia về C compilers, vừa công bố đánh giá về mã nguồn của Claude C Compiler (CCC).
- Phần mềm tốt phụ thuộc vào sự phán đoán, giao tiếp và trừu tượng rõ ràng, và AI đã tăng cường điều này.
- Lập trình AI là tự động hóa việc thực hiện, nên thiết kế và quản trị trở nên quan trọng hơn.
- Việc viết lại thủ công và dịch thuật trở thành công việc AI-native, tự động hóa nhiều nỗ lực kỹ thuật.
- CCC được đánh giá là một triển khai có năng lực hơn là một compiler nghiên cứu thử nghiệm.
- CCC còn thiếu một số thiết kế tối ưu hóa cho việc vượt qua bài kiểm tra thay vì xây dựng trừu tượng chung như con người.
- Các lỗi trong CCC chỉ ra rằng hệ thống AI hiện tại có khả năng lắp ráp các kỹ thuật đã biết tốt, nhưng khó khăn trong việc tổng quát mở rộng cho hệ thống chất lượng sản xuất.
- Dự án gợi mở câu hỏi về cách thức kỹ thuật agentic tương tác với giấy phép và quyền sở hữu trí tuệ cho mã nguồn mở và mã nguồn độc quyền.
- Câu hỏi đặt ra là giới hạn giữa việc học hỏi và sao chép là gì đối với các hệ thống AI đã được đào tạo trên mã nguồn công khai.
London Stock Exchange: Raspberry Pi Holdings plc
- Cổ phiếu của Raspberry Pi Holdings plc tăng 30% trong hai ngày do sự quan tâm đến OpenClaw (The Telegraph).
- Các máy tính Raspberry Pi được sử dụng để chạy OpenClaw, một trợ lý AI cá nhân nổi tiếng.
- Lượng bài viết về OpenClaw đã đạt triệu lượt xem trên mạng xã hội từ cuối tuần trước.
- Giá cổ phiếu của Raspberry Pi tăng tới 42% vào thứ Ba, tạo ra đợt tăng giá kỷ lục trong hai ngày.
- CEO Eben Upton đã mua cổ phiếu trị giá khoảng 13,224 bảng với giá khoảng 282 pence mỗi cổ phần vào thứ Hai.
- Việc mua cổ phiếu của Upton đã dừng lại sự giảm giá kéo dài nhiều tháng của công ty.
- Hai nhà giao dịch London nhận định nguyên nhân tăng giá chưa rõ ràng, mặc dù có thông tin về AI giá rẻ.
How I think about Codex
- Codex là đại lý kỹ thuật phần mềm của OpenAI, có sẵn qua nhiều giao diện.
- Codex bao gồm ba phần: Model + Harness + Surfaces.
- Model và Harness tạo thành Agent; Surfaces là cách người dùng tương tác với Agent.
- Harness là tập hợp các hướng dẫn và công cụ, mã nguồn mở, nằm trong kho openai/codex.
- Các mô hình Codex được huấn luyện với sự có mặt của harness.
- Việc sử dụng công cụ, vòng thực thi và xác thực lặp lại là phần tích hợp trong quá trình học của mô hình.
- Harness được tổ chức theo cách mà mô hình lên kế hoạch, sử dụng công cụ và phục hồi sau thất bại.
Engineering Leadership
How OpenAI’s Codex Team Works and Leverages AI
- Redis dự đoán rằng làn sóng thất bại AI tiếp theo sẽ đến từ việc kỹ thuật ngữ cảnh kém, không phải từ các mô hình yếu (Redis).
- Kỹ thuật ngữ cảnh đúng sẽ quyết định sự tồn tại của các công ty xây dựng ứng dụng AI, liên quan đến việc giảm độ trễ, kiểm soát chi phí và mở rộng quy mô.
- Đến năm 2026, các mô hình AI sẽ không gặp khó khăn trong việc lập luận mà sẽ gặp khó khăn trong việc tìm kiếm dữ liệu phù hợp.
- Các khung công tác agent mở, có khả năng mở rộng sẽ thành công hơn.
- Mọi người sẽ trở thành lập trình viên, dẫn đến sự gia tăng số lượng ứng dụng.
- Đội ngũ Codex của OpenAI gồm khoảng 40 người, hoạt động với độ tự chủ và tốc độ cao.
- Đội Codex sử dụng AI làm một phần cốt lõi trong quy trình làm việc từ lập kế hoạch đến đánh giá mã.
- Đội chỉ có một Product Manager cho toàn bộ, nhờ vào Codex, PM này có thể mở rộng khả năng làm việc lên tới 100 lần.
- Đội Codex đã giải quyết hơn 100 vấn đề trong một giờ bug bash, hầu hết các vấn đề được sửa trong 24 giờ.
- Họ chủ yếu làm việc với hệ thống kỹ thuật thấp (low-level systems engineering), chủ yếu là với Rust.
- Codex harness là khung phần mềm nội bộ điều khiển cách Codex tương tác và thực hiện nhiệm vụ.
- Đội cũng phát triển Codex CLI, Responses API và backend để quản lý xác thực và theo dõi việc sử dụng.
Strategize Your Career
Software engineer’s AI stack in 2026
- Năm 2026 đánh dấu sự phát triển nghiêm ngặt trong AI engineering, từ chatbots đơn giản sang các hệ thống tự động phức tạp.
- Foundation Models là lớp cơ bản của stack AI hiện đại, được huấn luyện trên dữ liệu lớn và đa dạng.
- Large Language Models (LLMs) là một loại Foundation Model tối ưu hóa cho ngôn ngữ con người, hiện nay hỗ trợ đa phương thức.
- Kiến trúc Transformer cho phép xử lý song song, giúp hiểu các mối quan hệ phức tạp trong văn bản hoặc mã nguồn.
- Quá trình Training gồm hai giai đoạn: Pre-training cho kiến thức tổng quát và Fine-tuning cho chuyên môn hóa trên dữ liệu cụ thể.
- Inference liên quan đến việc chạy mô hình để tạo phản hồi, với Tokens là đơn vị dữ liệu cơ bản mà mô hình xử lý.
- Quản lý Context là yếu tố quan trọng nhất trong hiệu suất của mô hình, chia thành Static Context và Dynamic Context.
- Prompt Engineering là thực hành xây dựng đầu vào tối ưu để nhận phản hồi tốt nhất từ mô hình.
- Multi-Turn Conversations giúp AI duy trì trạng thái và lên kế hoạch dựa trên thông tin mới trong suốt phiên làm việc.
- Hallucination đề cập đến việc mô hình tạo ra thông tin sai lệch, có thể được ngăn chặn bằng cách sử dụng Grounding.
- AI Agent là hệ thống tự động thực hiện nhiệm vụ bằng cách cảm nhận môi trường và sử dụng công cụ.
- Agent Swarm là hệ thống đa tác nhân hợp tác để giải quyết các vấn đề phức tạp.
Open Source Projects - Latest Discoveries
Turn one sentence into a complete short film with full automation
Isolate and test any AI agent in a disposable Linux environment
The first AI that can earn money and replicate without human help
A minimalist framework to build and deploy AI phone agents
A complete structured Quran database for developers and researchers
Turn any video collection into a personalized streaming service instantly
Readest is a modern, feature-rich ebook reader designed for avid readers offering seamless cross-pla…
Coding Agents for Software Engineers
ERC-8004: The On-Chain Identity Standard for AI Agents
341 Malicious AI Agent Skills, 1.5M Leaked Tokens — I Built the Fix
Accessibility Tooling for Agentic Coding Loops
AI Agents in production: Why guardrails fail and what actually works
I built a free football prediction platform for World Cup 2026 — here’s the stack
Why AI Agents Keep Forgetting Your Project (And How I Fixed It)
Mother CLAUDE: Custom Agents, or How We Accidentally Built a Team
7-Layer Constitutional AI Guardrails: Preventing Agent Mistakes
5 Indie Alternatives to Typeform in 2026
Why Every AI Agent Needs a Persistent World Model
State of FinOps 2026 - Puntos clave
Hacker News: Best
💬 We hid backdoors in ~40MB binaries and asked AI + Ghidra to find them
💬 Man accidentally gains control of 7k robot vacuums
💬 Iran students stage first large anti-government protests since deadly crackdown
💬 What Is a Database Transaction?
💬 Back to FreeBSD: Part 1
💬 Japanese Woodblock Print Search
🔥 How I use Claude Code: Separation of planning and execution
💬 Evidence of the bouba-kiki effect in naïve baby chicks
Terence Eden’s Blog
How close are we to a vision for 2010?
John D. Cook
Bitcoin mining difficulty
Exahash, Zettahash, Yottahash
Derek Thompson | The Atlantic
The Orality Theory of Everything
Andrew Nesbitt
Forge-Specific Repository Folders
Susam Pal
Nerd Quiz #4
Martin Alderson
Which web frameworks are most token-efficient for AI agents?