Simon Willison’s Weblog
I ported JustHTML from Python to JavaScript with Codex CLI and GPT-5.2 in 4.5 hours
- Tôi đã xây dựng thư viện phân tích HTML5 không có phụ thuộc bằng JavaScript, simonw/justjshtml, thành công từ dự án JustHTML của Emil Stenström.
- Thư viện này đã vượt qua 9,200 bài kiểm tra từ bộ thử nghiệm html5lib-tests và mô phỏng API của JustHTML.
- Quá trình tạo mã từ ý tưởng đến thư viện hoàn thành mất khoảng 4 giờ, trong khi tôi cũng tham gia trang trí cây thông Giáng sinh với gia đình.
- GPT-5.2 trên Codex CLI đã tiêu tốn 1,464,295 token đầu vào và sản xuất 9,000 dòng mã JavaScript qua 43 cam kết.
- HTML5 đã xác định cách phân tích HTML không hợp lệ, giúp các trình duyệt xử lý tài liệu theo cách đồng nhất (nguyên tắc này được phát triển cách đây 10 năm).
- Thư viện html5lib-tests được khởi động bởi dự án html5lib, trở thành tiêu chuẩn vàng cho thử nghiệm tính tương thích của các bộ phân tích HTML5.
- JustHTML là một dự án thuần Python cho bộ phân tích HTML5, qua đó đạt được kết quả vượt qua toàn bộ bộ kiểm tra của html5lib.
- Tôi yêu cầu Codex CLI xây dựng phiên bản JavaScript dựa trên mã Python của Emil Stenström.
2025 Word of the Year: Slop
- Merriam-Webster chọn “slop” làm từ của năm 2025.
- “Slop” được định nghĩa là nội dung kỹ thuật số chất lượng thấp do trí tuệ nhân tạo sản xuất với số lượng lớn.
- Từ này đã thua “brain rot” cho danh hiệu từ của năm 2024 do Oxford đưa ra.
Engineering Leadership
OpenAI’s Report: The State of Enterprise AI
- Mô hình “Admin, Editor, Viewer” không hiệu quả trong hệ thống multitenant.
- Nhu cầu về quyền truy cập chi tiết và theo ngữ cảnh gia tăng trong các tổ chức lớn.
- Ebook cung cấp các phương pháp ủy quyền động không cần tăng cường vai trò.
- Ngày 8 tháng 12 năm 2025, OpenAI công bố báo cáo về AI trong doanh nghiệp.
- Người dùng tiết kiệm trung bình 40-60 phút mỗi ngày nhờ vào công cụ AI.
- Úc đứng đầu thế giới về số lượng khách hàng doanh nghiệp trả phí của OpenAI.
- Khối lượng tin nhắn ChatGPT tăng 8 lần và số lượng token API tăng 320 lần theo năm.
- Số chỗ trên kế hoạch doanh nghiệp tăng gấp 9 lần từ tháng 11 năm 2024.
- Hơn 20% tin nhắn doanh nghiệp được xử lý qua Custom GPTs hoặc Projects.
- Công ty BBVA tạo ra hơn 4,000 GPTs, cho thấy áp dụng rộng rãi trong quy trình làm việc.
- Hơn 9,000 công ty vượt 10 tỷ token và gần 200 công ty vượt 1 nghìn tỷ token.
- Sự gia tăng sử dụng reasoning tokens khoảng 320 lần từ tháng 11 năm 2024.
The Developing Dev
Boris Cherny (Creator of Claude Code) On How His Career Grew
- Boris Cherny làm việc tại Meta và được thăng chức lên senior engineer nhờ dự án Chats in Groups.
- Dự án này kết hợp Messenger và Facebook, nhằm tạo ra không gian giao tiếp gần gũi hơn giữa người dùng.
- Trong quá trình phát triển dự án, Boris đã tự mình thực hiện nghiên cứu người dùng (UXR) bằng cách tương tác với nhân viên căng-tin.
- Tại Claude team ở Anthropic, Boris tiếp tục ưu tiên tuyển dụng các kỹ sư đa năng, không chỉ có kỹ năng lập trình mà còn có khả năng làm việc về sản phẩm và thiết kế.
- Boris cho rằng việc nằm ngoài “vùng an toàn” trong công việc tại Meta giúp ông trưởng thành và phát triển kỹ năng toàn diện.
- Ông gặp khó khăn trong việc quản lý quy trình phát triển sản phẩm với một đội ngũ nhỏ và đã phải tự mình phụ trách nhiều vai trò.
Open Source Projects - Latest Discoveries
A simple cross-platform tool to hide files inside PNG images
Cloudflare error page generator
A highly opinionated, zero-configuration linter and formatter
Run interactive PHP code in a standalone REPL shell
GUI for managing BibTeX and BibLaTeX (.bib) databases
Automate complex workflows on Kubernetes
Build AI-powered slides from a single sentence or outline with nano banana 🍌
Hacker News: Best
🔥 Upcoming Changes to Let’s Encrypt Certificates
🔥 “Super secure” messaging app leaks everyone’s phone number
🔥 Problems with D-Bus on the Linux desktop
🔥 Pro-democracy HK tycoon Jimmy Lai convicted in national security trial
🔥 Thousands of U.S. farmers have Parkinson’s. They blame a deadly pesticide
🔥 Carrier Landing in Top Gun for the NES
💬 It seems that OpenAI is scraping [certificate transparency] logs
🔥 I’m Kenyan. I don’t write like ChatGPT, ChatGPT writes like me
🔥 Avoid UUID Version 4 Primary Keys in Postgres
💬 Arborium: Tree-sitter code highlighting with Native and WASM targets
I Built 24 Free Developer Tools - No Signup, No Ads, No BS
AWS S3 Vectors: Finally, Cloud Scalable Vector Storage 🚀
Beyond the Wire: Encrypting Messages Where the Message Never Exists
Edge ML Has a Size Obsession
Vibe Coding: From Hell to Heaven in One Insight
Readable, Leakproof API with zero cost abstraction.
Title: Lightspeed Ventures Secures Record-Breaking $9 Billion in Fresh Capital to Fuel AI Innovation
274. H-Index | LeetCode | Top Interview 150 | Coding Questions
Awesome Robots Digest - Issue #14 - December 12, 2025
What I’m trying to understand
Awesome Robots Digest - Issue #13 - December 5, 2025
Day 1286 : Swimming