daily-digest

Simon Willison’s Weblog

The Claude C Compiler: What It Reveals About the Future of Software

Nicholas Carlini từ Anthropic viết về dự án sử dụng parallel Claudes để xây dựng một C compiler dựa trên Opus 4.6.
Chris Lattner, chuyên gia về C compilers, vừa công bố đánh giá về mã nguồn của Claude C Compiler (CCC).
Phần mềm tốt phụ thuộc vào sự phán đoán, giao tiếp và trừu tượng rõ ràng, và AI đã tăng cường điều này.
Lập trình AI là tự động hóa việc thực hiện, nên thiết kế và quản trị trở nên quan trọng hơn.
Việc viết lại thủ công và dịch thuật trở thành công việc AI-native, tự động hóa nhiều nỗ lực kỹ thuật.
CCC được đánh giá là một triển khai có năng lực hơn là một compiler nghiên cứu thử nghiệm.
CCC còn thiếu một số thiết kế tối ưu hóa cho việc vượt qua bài kiểm tra thay vì xây dựng trừu tượng chung như con người.
Các lỗi trong CCC chỉ ra rằng hệ thống AI hiện tại có khả năng lắp ráp các kỹ thuật đã biết tốt, nhưng khó khăn trong việc tổng quát mở rộng cho hệ thống chất lượng sản xuất.
Dự án gợi mở câu hỏi về cách thức kỹ thuật agentic tương tác với giấy phép và quyền sở hữu trí tuệ cho mã nguồn mở và mã nguồn độc quyền.
Câu hỏi đặt ra là giới hạn giữa việc học hỏi và sao chép là gì đối với các hệ thống AI đã được đào tạo trên mã nguồn công khai.

London Stock Exchange: Raspberry Pi Holdings plc

Cổ phiếu của Raspberry Pi Holdings plc tăng 30% trong hai ngày do sự quan tâm đến OpenClaw (The Telegraph).
Các máy tính Raspberry Pi được sử dụng để chạy OpenClaw, một trợ lý AI cá nhân nổi tiếng.
Lượng bài viết về OpenClaw đã đạt triệu lượt xem trên mạng xã hội từ cuối tuần trước.
Giá cổ phiếu của Raspberry Pi tăng tới 42% vào thứ Ba, tạo ra đợt tăng giá kỷ lục trong hai ngày.
CEO Eben Upton đã mua cổ phiếu trị giá khoảng 13,224 bảng với giá khoảng 282 pence mỗi cổ phần vào thứ Hai.
Việc mua cổ phiếu của Upton đã dừng lại sự giảm giá kéo dài nhiều tháng của công ty.
Hai nhà giao dịch London nhận định nguyên nhân tăng giá chưa rõ ràng, mặc dù có thông tin về AI giá rẻ.

How I think about Codex

Codex là đại lý kỹ thuật phần mềm của OpenAI, có sẵn qua nhiều giao diện.
Codex bao gồm ba phần: Model + Harness + Surfaces.
Model và Harness tạo thành Agent; Surfaces là cách người dùng tương tác với Agent.
Harness là tập hợp các hướng dẫn và công cụ, mã nguồn mở, nằm trong kho openai/codex.
Các mô hình Codex được huấn luyện với sự có mặt của harness.
Việc sử dụng công cụ, vòng thực thi và xác thực lặp lại là phần tích hợp trong quá trình học của mô hình.
Harness được tổ chức theo cách mà mô hình lên kế hoạch, sử dụng công cụ và phục hồi sau thất bại.

Engineering Leadership

How OpenAI’s Codex Team Works and Leverages AI

Redis dự đoán rằng làn sóng thất bại AI tiếp theo sẽ đến từ việc kỹ thuật ngữ cảnh kém, không phải từ các mô hình yếu (Redis).
Kỹ thuật ngữ cảnh đúng sẽ quyết định sự tồn tại của các công ty xây dựng ứng dụng AI, liên quan đến việc giảm độ trễ, kiểm soát chi phí và mở rộng quy mô.
Đến năm 2026, các mô hình AI sẽ không gặp khó khăn trong việc lập luận mà sẽ gặp khó khăn trong việc tìm kiếm dữ liệu phù hợp.
Các khung công tác agent mở, có khả năng mở rộng sẽ thành công hơn.
Mọi người sẽ trở thành lập trình viên, dẫn đến sự gia tăng số lượng ứng dụng.
Đội ngũ Codex của OpenAI gồm khoảng 40 người, hoạt động với độ tự chủ và tốc độ cao.
Đội Codex sử dụng AI làm một phần cốt lõi trong quy trình làm việc từ lập kế hoạch đến đánh giá mã.
Đội chỉ có một Product Manager cho toàn bộ, nhờ vào Codex, PM này có thể mở rộng khả năng làm việc lên tới 100 lần.
Đội Codex đã giải quyết hơn 100 vấn đề trong một giờ bug bash, hầu hết các vấn đề được sửa trong 24 giờ.
Họ chủ yếu làm việc với hệ thống kỹ thuật thấp (low-level systems engineering), chủ yếu là với Rust.
Codex harness là khung phần mềm nội bộ điều khiển cách Codex tương tác và thực hiện nhiệm vụ.
Đội cũng phát triển Codex CLI, Responses API và backend để quản lý xác thực và theo dõi việc sử dụng.

Strategize Your Career

Software engineer’s AI stack in 2026

Năm 2026 đánh dấu sự phát triển nghiêm ngặt trong AI engineering, từ chatbots đơn giản sang các hệ thống tự động phức tạp.
Foundation Models là lớp cơ bản của stack AI hiện đại, được huấn luyện trên dữ liệu lớn và đa dạng.
Large Language Models (LLMs) là một loại Foundation Model tối ưu hóa cho ngôn ngữ con người, hiện nay hỗ trợ đa phương thức.
Kiến trúc Transformer cho phép xử lý song song, giúp hiểu các mối quan hệ phức tạp trong văn bản hoặc mã nguồn.
Quá trình Training gồm hai giai đoạn: Pre-training cho kiến thức tổng quát và Fine-tuning cho chuyên môn hóa trên dữ liệu cụ thể.
Inference liên quan đến việc chạy mô hình để tạo phản hồi, với Tokens là đơn vị dữ liệu cơ bản mà mô hình xử lý.
Quản lý Context là yếu tố quan trọng nhất trong hiệu suất của mô hình, chia thành Static Context và Dynamic Context.
Prompt Engineering là thực hành xây dựng đầu vào tối ưu để nhận phản hồi tốt nhất từ mô hình.
Multi-Turn Conversations giúp AI duy trì trạng thái và lên kế hoạch dựa trên thông tin mới trong suốt phiên làm việc.
Hallucination đề cập đến việc mô hình tạo ra thông tin sai lệch, có thể được ngăn chặn bằng cách sử dụng Grounding.
AI Agent là hệ thống tự động thực hiện nhiệm vụ bằng cách cảm nhận môi trường và sử dụng công cụ.
Agent Swarm là hệ thống đa tác nhân hợp tác để giải quyết các vấn đề phức tạp.

daily-digest

Simon Willison’s Weblog

Engineering Leadership

Strategize Your Career

Open Source Projects - Latest Discoveries

DEV Community

Hacker News: Best

Terence Eden’s Blog

John D. Cook

Derek Thompson | The Atlantic

Andrew Nesbitt

Susam Pal

Martin Alderson