Simon Willison’s Weblog
Structured Context Engineering for File-Native Agentic Systems
- Nghiên cứu của Damon McMillan thực hiện 9.649 thí nghiệm trên 11 mô hình với 4 định dạng: YAML, Markdown, JSON và TOON.
- Các lược đồ dữ liệu trong nghiên cứu có kích thước từ 10 đến 10.000 bảng.
- Mô hình tiên tiến như Opus 4.5, GPT-5.2, và Gemini 2.5 Pro vượt trội hơn so với các mô hình mã nguồn mở như DeepSeek V3.2, Kimi K2, Llama 4.
- Mô hình tiên tiến tận dụng tốt hơn việc lấy ngữ cảnh từ hệ thống tệp, trong khi mô hình mã nguồn mở có kết quả kém thuyết phục hơn.
- Bảng xếp hạng Terminal Bench 2.0 vẫn do Anthropic, OpenAI và Gemini dẫn đầu.
- Kết quả “grep tax” cho thấy TOON, mặc dù được thiết kế để biểu diễn dữ liệu có cấu trúc với số token tối thiểu, lại khiến mô hình tiêu tốn nhiều token hơn do không quen thuộc với định dạng này.
AI Doesn’t Reduce Work—It Intensifies It
- Nghiên cứu của Aruna Ranganathan và Xingqi Maggie Ye từ Berkeley Haas chỉ ra rằng AI không giảm khối lượng công việc mà làm tăng cường độ công việc (Harvard Business Review, tháng 4-12/2025).
- Nhân viên công ty công nghệ ở Mỹ quản lý nhiều nhiệm vụ cùng lúc nhờ AI, ví dụ như viết mã và tạo phiên bản thay thế (200 nhân viên tham gia nghiên cứu).
- Sự xuất hiện của AI tạo cảm giác có “đối tác” giúp nâng cao năng suất, nhưng đồng thời dẫn đến việc chuyển đổi liên tục giữa các nhiệm vụ và gia tăng khối lượng nhận thức.
- Nhiều người cảm thấy mệt mỏi, thậm chí mất ngủ vì sự cám dỗ tạo ra tính năng mới với “chỉ một prompt nữa”.
- Bài viết kêu gọi các tổ chức xây dựng “thực hành AI” để sử dụng AI một cách có cấu trúc, nhằm tránh tình trạng kiệt sức và phân biệt giữa tăng năng suất thực sự và cường độ công việc không bền vững.
- Cần thời gian và kỷ luật để tìm ra sự cân bằng mới trong cách làm việc.
Engineering Leadership
96% Engineers Don’t Fully Trust AI Output, Yet Only 48% Verify It
- Buf tổ chức workshop trực tuyến về Protobuf API Governance vào ngày 19 tháng 2.
- 96% kỹ sư không tin tưởng vào đầu ra mã của AI, chỉ 48% kiểm tra chất lượng.
- 61% đồng ý rằng AI thường sản xuất mã đúng hình thức nhưng không đáng tin cậy.
- 57% kỹ sư lo ngại về việc AI có thể làm lộ dữ liệu nhạy cảm.
- 35% kỹ sư sử dụng AI qua tài khoản cá nhân.
- Khảo sát có 1149 người tham gia, chủ yếu là kỹ sư phần mềm, được thực hiện vào tháng 10 năm 2025.
- Dự đoán mã do AI tạo ra sẽ tăng từ 42% lên 65% vào năm 2027.
- Việc sử dụng AI phổ biến nhất là viết tài liệu, hiểu và giải thích mã hiện có.
- Chỉ 48% kỹ sư luôn kiểm tra mã do AI tạo trước khi cam kết.
- Trách nhiệm luôn thuộc về kỹ sư sử dụng AI, không phải AI.
- Kỹ sư cần xác minh mã do AI tạo thay vì tin tưởng mù quáng.
- Việc xây dựng công cụ nội bộ bằng AI là cách hiệu quả để nâng cao năng suất.
Martin Fowler
Fragments: February 9
- Cuộc họp tập trung vào tương lai của phát triển phần mềm trong kỷ nguyên AI, với các ý kiến được ghi nhận theo Quy tắc Chatham House.
- Tác giả bày tỏ sự hoài nghi về giá trị của LLMs, nhấn mạnh rằng nhiều công cụ trong quá khứ đã hứa hẹn thay đổi hoàn toàn nhưng không hiệu quả.
- Vấn đề “cognitive debt” được thảo luận, đặt câu hỏi về việc LLMs có thể làm giảm khả năng học hỏi của các phát triển viên hay không.
- Chu trình TDD cần có bước tương tự như tối ưu hóa mã để phát triển hiểu biết chung giữa các lập trình viên.
- Có quan điểm cho rằng LLMs giống như “người buôn ma túy”, cung cấp mã nhưng không quan tâm đến hệ thống dài hạn.
- Lập trình viên lo ngại về việc LLMs có thể làm giảm tính thú vị trong nghề lập trình và ảnh hưởng đến quá trình xây dựng mô hình.
- Có thể tồn tại một định nghĩa lại về “source code” với vai trò của ngôn ngữ tự nhiên và tính không xác định trong mã nguồn.
- Lý thuyết về các công cụ Language Workbenches có thể quay trở lại với sự phát triển của LLMs, tìm cách tối ưu hóa diễn đạt với số lượng ký tự tối thiểu.
- Khái niệm mã nguồn không thể hiểu nổi cho con người có thể là tương lai của lập trình.
- Trong cộng đồng mã nguồn mở, nhiều quản trị viên ngần ngại với các yêu cầu do AI tạo ra và cần phải chuẩn bị cho việc tích hợp AI vào quy trình làm việc.
The Developing Dev
Meta Distinguished Eng (IC9) On Influencing Engs, Failures, and Learnings
- Adam Ernst là một Kỹ sư Xuất sắc tại Meta (IC9), xây dựng cơ sở hạ tầng iOS có ảnh hưởng lớn đến công ty.
- Ông bắt đầu viết phần mềm từ khi còn học trung học, với công ty Cosmic Soft.
- Sản phẩm đầu tiên của ông là phần mềm kiểm tra trực tuyến, viết bằng Real Basic.
- Ông đã bán phần mềm qua Internet sử dụng dịch vụ Ecelerate, nhận thanh toán bằng thẻ tín dụng và séc.
- Adam gia nhập Meta để giúp viết lại ứng dụng native từ HTML5, bắt đầu ở cấp E5.
- Ông nhanh chóng thăng chức lên Staff (E6) nhờ kinh nghiệm ngành nghề.
- Adam đã trải qua một dự án lớn thất bại và học được nhiều bài học từ đó.
Open Source Projects - Latest Discoveries
Structure your 3D generation pipeline with native compact latents from images
Reading Weather Charts Is So 2025
Why I keep a personal work log even when the team has a task tracker
Day 9 of 100 Days of Code — Understanding the React Context API
I built my own local AI assistant with Python (runs fully offline)
Google Cloud AI Agents with Gemini 3: Building Multi-Agent Systems That Actually Work
Impressions on the Book “Tidy First? A Personal Exercise in Empirical Software Design” by Kent Beck
Stop Wrestling with Medical Data: Building a FHIR-Native AI Agent for Automated Patient Triage 🏥
Accelerating Code Quality at Scale with FloTorch Blueprints
Email Verification APIs Compared: 2026 Benchmark (With Real Pricing)
Let’s learn something about reactive programming and a way to make your application flux more SECURE ?
READ BELOW AND KNOW HOW DO IT
How to Build and Test iOS Apps on a Physical Phone: Expo EAS and Apple TestFlight (Part 1/3)
A dev coding setup in 2026
Hacker News: Best
🔥 Another GitHub outage in the same day
🔥 Converting a $3.88 analog clock from Walmart into a ESP8266-based Wi-Fi clock
💬 GitHub Is Down
🔥 GitHub is down again
🔥 Why is the sky blue?
🔥 Discord will require a face scan or ID for full access next month
💬 AT&T, Verizon blocking release of Salt Typhoon security assessment reports
🔥 Show HN: Algorithmically finding the longest line of sight on Earth
🔥 Nobody knows how the whole system works
🔥 TSMC to make advanced AI semiconductors in Japan
iDiallo.com
Microsoft Should Watch The Expanse
Pluralistic: Daily links from Cory Doctorow
Pluralistic: The Epstein class and collapse porn (09 Feb 2026)
Terence Eden’s Blog
Gadget Review: Orico Power Strip (UK) ★★⯪☆☆
The Old New Thing
What should I do if a wait call reports WAIT_ABANDONED?
Armin Ronacher’s Thoughts and Writings
A Language For Agents
Westenberg.
The pitch deck is dead. Write a pitch.md instead.
Andrew Nesbitt
Package Manager Podcast Episodes
Jim Nielsen’s Blog
A Brief History of App Icons From Apple’s Creator Studio
The Silicon Underground
Buy.com’s Feb 2000 IPO
matduggan.com
GitButler CLI Is Really Good
Troy Hunt
Weekly Update 490