daily-digest

Simon Willison’s Weblog

Structured Context Engineering for File-Native Agentic Systems

Nghiên cứu của Damon McMillan thực hiện 9.649 thí nghiệm trên 11 mô hình với 4 định dạng: YAML, Markdown, JSON và TOON.
Các lược đồ dữ liệu trong nghiên cứu có kích thước từ 10 đến 10.000 bảng.
Mô hình tiên tiến như Opus 4.5, GPT-5.2, và Gemini 2.5 Pro vượt trội hơn so với các mô hình mã nguồn mở như DeepSeek V3.2, Kimi K2, Llama 4.
Mô hình tiên tiến tận dụng tốt hơn việc lấy ngữ cảnh từ hệ thống tệp, trong khi mô hình mã nguồn mở có kết quả kém thuyết phục hơn.
Bảng xếp hạng Terminal Bench 2.0 vẫn do Anthropic, OpenAI và Gemini dẫn đầu.
Kết quả “grep tax” cho thấy TOON, mặc dù được thiết kế để biểu diễn dữ liệu có cấu trúc với số token tối thiểu, lại khiến mô hình tiêu tốn nhiều token hơn do không quen thuộc với định dạng này.

AI Doesn’t Reduce Work—It Intensifies It

Nghiên cứu của Aruna Ranganathan và Xingqi Maggie Ye từ Berkeley Haas chỉ ra rằng AI không giảm khối lượng công việc mà làm tăng cường độ công việc (Harvard Business Review, tháng 4-12/2025).
Nhân viên công ty công nghệ ở Mỹ quản lý nhiều nhiệm vụ cùng lúc nhờ AI, ví dụ như viết mã và tạo phiên bản thay thế (200 nhân viên tham gia nghiên cứu).
Sự xuất hiện của AI tạo cảm giác có “đối tác” giúp nâng cao năng suất, nhưng đồng thời dẫn đến việc chuyển đổi liên tục giữa các nhiệm vụ và gia tăng khối lượng nhận thức.
Nhiều người cảm thấy mệt mỏi, thậm chí mất ngủ vì sự cám dỗ tạo ra tính năng mới với “chỉ một prompt nữa”.
Bài viết kêu gọi các tổ chức xây dựng “thực hành AI” để sử dụng AI một cách có cấu trúc, nhằm tránh tình trạng kiệt sức và phân biệt giữa tăng năng suất thực sự và cường độ công việc không bền vững.
Cần thời gian và kỷ luật để tìm ra sự cân bằng mới trong cách làm việc.

Engineering Leadership

96% Engineers Don’t Fully Trust AI Output, Yet Only 48% Verify It

Buf tổ chức workshop trực tuyến về Protobuf API Governance vào ngày 19 tháng 2.
96% kỹ sư không tin tưởng vào đầu ra mã của AI, chỉ 48% kiểm tra chất lượng.
61% đồng ý rằng AI thường sản xuất mã đúng hình thức nhưng không đáng tin cậy.
57% kỹ sư lo ngại về việc AI có thể làm lộ dữ liệu nhạy cảm.
35% kỹ sư sử dụng AI qua tài khoản cá nhân.
Khảo sát có 1149 người tham gia, chủ yếu là kỹ sư phần mềm, được thực hiện vào tháng 10 năm 2025.
Dự đoán mã do AI tạo ra sẽ tăng từ 42% lên 65% vào năm 2027.
Việc sử dụng AI phổ biến nhất là viết tài liệu, hiểu và giải thích mã hiện có.
Chỉ 48% kỹ sư luôn kiểm tra mã do AI tạo trước khi cam kết.
Trách nhiệm luôn thuộc về kỹ sư sử dụng AI, không phải AI.
Kỹ sư cần xác minh mã do AI tạo thay vì tin tưởng mù quáng.
Việc xây dựng công cụ nội bộ bằng AI là cách hiệu quả để nâng cao năng suất.

Martin Fowler

Fragments: February 9

Cuộc họp tập trung vào tương lai của phát triển phần mềm trong kỷ nguyên AI, với các ý kiến được ghi nhận theo Quy tắc Chatham House.
Tác giả bày tỏ sự hoài nghi về giá trị của LLMs, nhấn mạnh rằng nhiều công cụ trong quá khứ đã hứa hẹn thay đổi hoàn toàn nhưng không hiệu quả.
Vấn đề “cognitive debt” được thảo luận, đặt câu hỏi về việc LLMs có thể làm giảm khả năng học hỏi của các phát triển viên hay không.
Chu trình TDD cần có bước tương tự như tối ưu hóa mã để phát triển hiểu biết chung giữa các lập trình viên.
Có quan điểm cho rằng LLMs giống như “người buôn ma túy”, cung cấp mã nhưng không quan tâm đến hệ thống dài hạn.
Lập trình viên lo ngại về việc LLMs có thể làm giảm tính thú vị trong nghề lập trình và ảnh hưởng đến quá trình xây dựng mô hình.
Có thể tồn tại một định nghĩa lại về “source code” với vai trò của ngôn ngữ tự nhiên và tính không xác định trong mã nguồn.
Lý thuyết về các công cụ Language Workbenches có thể quay trở lại với sự phát triển của LLMs, tìm cách tối ưu hóa diễn đạt với số lượng ký tự tối thiểu.
Khái niệm mã nguồn không thể hiểu nổi cho con người có thể là tương lai của lập trình.
Trong cộng đồng mã nguồn mở, nhiều quản trị viên ngần ngại với các yêu cầu do AI tạo ra và cần phải chuẩn bị cho việc tích hợp AI vào quy trình làm việc.

The Developing Dev

Meta Distinguished Eng (IC9) On Influencing Engs, Failures, and Learnings

Adam Ernst là một Kỹ sư Xuất sắc tại Meta (IC9), xây dựng cơ sở hạ tầng iOS có ảnh hưởng lớn đến công ty.
Ông bắt đầu viết phần mềm từ khi còn học trung học, với công ty Cosmic Soft.
Sản phẩm đầu tiên của ông là phần mềm kiểm tra trực tuyến, viết bằng Real Basic.
Ông đã bán phần mềm qua Internet sử dụng dịch vụ Ecelerate, nhận thanh toán bằng thẻ tín dụng và séc.
Adam gia nhập Meta để giúp viết lại ứng dụng native từ HTML5, bắt đầu ở cấp E5.
Ông nhanh chóng thăng chức lên Staff (E6) nhờ kinh nghiệm ngành nghề.
Adam đã trải qua một dự án lớn thất bại và học được nhiều bài học từ đó.

daily-digest

Simon Willison’s Weblog

Engineering Leadership

Martin Fowler

The Developing Dev

Open Source Projects - Latest Discoveries

DEV Community

Hacker News: Best

iDiallo.com

Pluralistic: Daily links from Cory Doctorow

Terence Eden’s Blog

The Old New Thing

Armin Ronacher’s Thoughts and Writings

Westenberg.

Andrew Nesbitt

Jim Nielsen’s Blog

The Silicon Underground

matduggan.com

Troy Hunt