Simon Willison’s Weblog
What is agentic engineering?
- Agentic engineering là việc phát triển phần mềm với sự hỗ trợ của các coding agents.
- Coding agents có khả năng viết và thực thi code, như Claude Code, OpenAI Codex và Gemini CLI.
- Định nghĩa của một agent là: các tác nhân chạy công cụ trong vòng lặp để đạt được mục tiêu.
- Coding agent nhận lệnh để xác định mục tiêu và tạo ra cùng thực thi code cho đến khi mục tiêu được hoàn thành.
- Khả năng thực thi code là yếu tố quyết định cho agentic engineering.
- Vai trò của con người trong phần mềm không chỉ là viết code mà còn là tìm ra giải pháp tốt nhất cho vấn đề.
- Cần cung cấp cho coding agents công cụ để giải quyết vấn đề và phải xác định chi tiết đúng mức.
- Các coding agents có thể học từ những sai lầm trước đó nếu được cập nhật hướng dẫn và công cụ phù hợp.
- Sử dụng hiệu quả coding agents giúp tăng cường sự tham vọng và sản xuất nhiều code chất lượng cao hơn.
- Tài liệu “Agentic Engineering Patterns” vẫn đang trong quá trình hoàn thiện và sẽ được cập nhật theo sự phát triển của công nghệ.
Engineering Leadership
Startups Should Evaluate Engineers Differently From Big Companies
- Blitzy là nền tảng phát triển phần mềm tự động đầu tiên với khả năng hiểu biết mã code vô hạn, giúp các công ty Fortune 500 phát triển nhanh hơn gấp 5 lần từ thiết kế Figma đến mã sản xuất.
- Blitzy tích hợp Figma để chuyển đổi thiết kế thành mã front-end chính xác và kết nối với back-end.
- 80% công việc được thực hiện một cách tự động nhờ vào hơn 3,000 agent chuyên biệt.
- Neil Matthams, nhà sáng lập Functionn, chỉ ra rằng quy trình tuyển dụng của nhiều công ty khởi nghiệp sao chép sai cách từ các công ty lớn, dẫn đến việc tuyển đúng kỹ sư không hiệu quả.
- Kinh nghiệm cho thấy, một tuyển dụng kỹ sư không phù hợp có thể tiêu tốn từ ba đến sáu tháng mất đà phát triển cho công ty khởi nghiệp.
- Các công ty lớn cần hệ thống đánh giá chuẩn hóa để sàng lọc ứng viên, trong khi các công ty khởi nghiệp cần ứng viên có khả năng tạo ra quy trình từ đầu.
- Ứng viên cho startup nên có khả năng làm việc độc lập và đảm nhận nhiều vai trò, điều mà các công ty lớn thường không đánh giá cao.
Strategize Your Career
Scaling Software Engineering with AI
- Tin tức công nghệ về Amazon và sự cố thường bỏ qua vấn đề thực sự.
- AI có thể gây ra sự cố bằng cách làm hỏng sản phẩm hoặc làm tràn ngập kỹ sư với quá nhiều mã code.
- Mọi đoạn mã của kỹ sư không phải cấp cao đều cần sự phê duyệt từ người có kinh nghiệm.
- Đặc điểm của phát triển hiện đại là nút thắt không còn nằm ở tốc độ viết mã.
- Trước AI, mỗi kỹ sư xử lý 1 diff mỗi ngày; sau AI, con số này tăng lên 5 diffs mỗi ngày.
- Quy trình kỹ thuật cần được điều chỉnh khi quy mô kỹ sư tăng từ 10 lên 1000.
- Cần áp dụng các phương pháp kỹ thuật tốt để sử dụng AI một cách hiệu quả.
- Quy trình kiểm tra thủ công tạo ra cảm giác an toàn sai lầm và làm giảm năng suất.
- Cần tự động hóa pipeline triển khai để tiết kiệm thời gian và cải thiện quy trình.
- Quy trình chuyển từ kiểm tra thủ công sang triển khai tự động cần những cải tiến cụ thể để đảm bảo an toàn.
- Đầu tư vào tự động hóa mang lại lợi ích lớn trong dài hạn, cho phép ít kỹ sư quản lý nhiều dịch vụ hơn.
- Đảm bảo tất cả cơ sở hạ tầng được triển khai dưới dạng mã và thêm các bài kiểm tra vào pipeline để cải thiện hiệu suất.
Daring Fireball
CHM Live: Apple at 50
‘This Is Not the Computer for You’
- Các đánh giá máy tính thường chỉ ra sản phẩm phù hợp với từng nhóm người dùng như học sinh, chuyên gia, hay người dùng chuyên nghiệp.
- MacBook Neo có giá 599 USD, trang bị chip A18 Pro, 8GB RAM, hướng đến nhóm người dùng cơ bản.
- Đánh giá cho rằng nó không phù hợp cho những tác vụ nặng như Xcode hay Final Cut, nhưng điều đó không thể ngăn cản đam mê sáng tạo.
- Đam mê học hỏi thường bắt đầu với thiết bị không hoàn hảo và khai thác tối đa giới hạn của nó để hiểu về công nghệ.
- MacBook Neo giữ lại các tính năng phần mềm của macOS và khả năng tùy chỉnh, mặc dù hy sinh một số yếu tố phần cứng khác.
- Giới hạn của MacBook Neo nằm ở tài nguyên như RAM và tốc độ đồng hồ chip, không phải do hạn chế từ nhà sản xuất.
- Sản phẩm này phù hợp cho những người trẻ đang tìm kiếm cơ hội học hỏi và phát triển, không phải cho những người đã có thiết bị chuyên nghiệp.
Blaming AI for Layoffs: ‘It Plays Better’
- 92% công ty ở Mỹ lên kế hoạch tuyển dụng vào năm 2026, với 86% dự định tuyển dụng trong quý 1 (Resume.org).
- 55% công ty dự đoán sa thải nhân viên trong năm 2026, bao gồm 48% xác nhận sẽ sa thải trong quý 1.
- Các lý do chính cho sa thải bao gồm AI (44%), tái cấu trúc (42%) và hạn chế ngân sách (39%).
- 59% công ty thừa nhận nhấn mạnh AI khi giải thích về việc đông lạnh tuyển dụng hoặc sa thải, vì lý do này thu hút hơn so với hạn chế tài chính.
- Kỹ năng quan trọng nhất mà các công ty cần vào năm 2026 là giải quyết vấn đề (54%), khả năng học các công cụ mới nhanh chóng (44%) và kỹ năng giao tiếp (43%).
- 48% công ty sẽ chắc chắn hoặc có khả năng tiến hành sa thải trong quý 1 năm 2026, và 8% dự đoán sa thải vào cuối năm 2026.
- Có 45% công ty cho biết AI đã giảm bớt nhu cầu tuyển dụng mới nhưng chỉ 9% cho rằng AI đã thay thế hoàn toàn một số vai trò.
- 60% công ty thú nhận đã sử dụng AI như một lý do cho việc đông lạnh tuyển dụng hoặc sa thải để dễ được chấp nhận hơn từ các bên liên quan.
- Kỹ năng thích ứng (39%) và kỹ năng làm việc nhóm (36%) cũng rất được ưu tiên dans mục tiêu tuyển dụng.
Horace Dediu on Apple Sitting Out the AI Spending Race
-
Apple là công ty có giá trị thứ ba trên thế giới và đã không đầu tư vào AI như các đối thủ, trong khi họ tiêu tốn tổng cộng 650 tỷ USD cho cơ sở hạ tầng AI (2023).
-
Amazon đầu tư 200 tỷ USD, Google 185 tỷ USD, Microsoft 114 tỷ USD và Meta 135 tỷ USD vào AI trong năm nay, trong khi ngân sách vốn của Apple chỉ khoảng 14 tỷ USD.
-
Các công ty công nghệ lớn đang đầu tư 94% dòng tiền hoạt động vào hạ tầng AI, dẫn đến dự báo dòng tiền tự do của Alphabet giảm 90% từ 73 tỷ USD xuống 8 tỷ USD.
-
Các công ty lớn đã huy động 121 tỷ USD trái phiếu vào năm 2025 và đang gánh nợ công nghệ 1,5 trillion USD, lần đầu tiên họ nợ nhiều hơn tiền mặt.
-
Chi phí 650 tỷ USD cho AI chỉ mang lại doanh thu khoảng 35 tỷ USD, tức chỉ đạt 5% so với chi phí đầu tư.
-
Apple não hiểu rằng các mô hình AI có khả năng trở nên bình thường hóa nhanh hơn dự kiến, vì vậy họ đã cấp phép mô hình Gemini của Google với giá khoảng 1 tỷ USD/năm thay vì tự xây dựng.
-
Chip M5 của Apple có Neural Engine và Neural Accelerators trong mỗi GPU, cung cấp hiệu suất AI gấp 4 lần so với M4 mà không cần đầu tư hàng trăm tỷ vào trung tâm dữ liệu.
-
Apple biến 2 tỷ thiết bị của mình, bao gồm iPhone, Mac và iPad, thành một trung tâm dữ liệu phân phối quy mô lớn mà không ai có thể so sánh.
-
Trong khi đối thủ của mình tiêu tốn tiền mặt, Apple thực hiện 90,7 tỷ USD mua lại cổ phiếu trong năm tài chính trước, ngược lại với việc mua lại của các công ty đối thủ đã giảm 74%.
-
Apple tin rằng người chiến thắng trong lĩnh vực AI sẽ là những ai sở hữu khách hàng, không phải những người xây dựng hạ tầng.
Reuters: ‘Meta Planning Sweeping Layoffs as AI Costs Mount’
iDiallo.com
Shower Thought: Git Teleportation
- Trong nhiều chương trình khoa học viễn tưởng, tàu vũ trụ có cơ chế dịch chuyển để crew khám phá bề mặt hành tinh trong khi tàu vẫn ở quỹ đạo.
- Có hai giả thuyết về cách hoạt động của thiết bị dịch chuyển: phân tích và tái tạo tất cả các nguyên tử hoặc quét người rồi sao chép.
- Tác giả đề xuất khái niệm “Diff Teleportation”, áp dụng quy trình Git vào dịch chuyển.
- Khi bước lên thiết bị, người dùng chạy lệnh Git để tạo nhánh cho nhiệm vụ dịch chuyển.
- Thiết bị sẽ tạm dừng nhánh chính để dễ dàng gộp nhánh trong tương lai.
- Khi nhiệm vụ hoàn thành, dữ liệu có thể phân tích và tổng hợp lại vào nhánh chính.
- Quá trình dịch chuyển yêu cầu tiêu diệt bản sao của người được dịch chuyển để tránh việc bị nhân bản.
- Có thể tạo nhiều bản sao để khám phá khác nhau, rồi gộp dữ liệu lại cho người gốc.
- Mỗi lần dịch chuyển, ít nhất hai bản sao sẽ bị tiêu diệt để đảm bảo thành công.
- Kết thúc với việc tái tạo bản gốc với dữ liệu mới từ cuộc khám phá.
Terence Eden’s Blog
Book Review: Robots in Space - The Secret Lives of Our Planetary Explorers by Dr Ezzy Pearson ★★★⯪☆
- Sao Hỏa là hành tinh duy nhất có người máy hoàn toàn sinh sống.
- Cuốn sách là tập hợp lịch sử của các nhà thám hiểm robot, không đề cập nhiều đến các nhiệm vụ có người lái.
- Tác giả nêu rõ thực tiễn hạ cánh robot cách xa một triệu dặm, nhân sự thực hiện và chính trị liên quan.
- Phân tích chính trị trong cuốn sách khá yếu kém và một chiều.
- Hình ảnh trong sách rất đẹp nhưng ebook để phần lớn ở cuối, không lồng ghép với văn bản.
- Có ít nhất một hình ảnh không chính xác, nhưng liên kết đến hình ảnh đúng trên trang web của NASA.
- Cuốn sách mô tả những vấn đề mà các cơ quan không gian gặp phải khi cố gắng đưa máy móc vào không gian.
- Một lỗi máy tính nhỏ đã dẫn đến sự cố lớn với Phobos 1, do thiếu một dấu gạch ngang trong mã lệnh.
- Cuốn sách là khởi đầu tốt cho những ai quan tâm đến thám hiểm không gian và các thách thức kỹ thuật, chính trị.
John D. Cook
Twelve-tone composition
- Âm nhạc atonal khó sáng tác vì nó đi ngược lại bản năng con người.
- Kỹ thuật phổ biến trong âm nhạc atonal là twelve-tone row, sử dụng một hoán vị 12 nốt trong thang âm chromatic.
- Các nốt trong tone row được sử dụng theo thứ tự cố định, mặc dù có thể thay đổi độ dài và quãng tám.
- Có các biến thể cho phép một số sự đa dạng như đảo ngược (retrograde), đảo ngược khoảng cách (inversion), và cả hai (retrograde inversion).
- Số lượng tone rows khả thi là 11! do các hoán vị bắt đầu từ điểm khác nhau không được coi là khác nhau.
- Các phép toán tạo ra dạng retrograde và inverted tạo thành một nhóm Abelian, bao gồm các yếu tố P (prime), R, I, và RI (hoặc IR).
- Nhóm này là isomorphic với ℤ2 × ℤ2.
- Tác giả không thích đa số các ý tưởng sử dụng toán học để sáng tác nhạc, đặc biệt là âm nhạc atonal, nhưng thích một số thể loại “math rock.”
- Tác giả chia sẻ kỷ niệm khi nghe một buổi hòa nhạc organ, nơi nghệ sĩ đã ứng tác fugue từ các giai điệu không nhìn thấy trước.
- Tác giả đã nhận ra dạng tone row của Schoenberg trong một phần ứng tác, mặc dù không thực sự nhận biết chính xác.
Langford series
- Dãy số có các số từ 1 đến 12 xuất hiện hai lần (8 6 10 3 1 11 1 3 6 8 12 9 7 10 4 2 5 11 2 4 7 9 5 12).
- Giữa hai số 1 có một số; giữa hai số 2 có hai số; giữa hai số 3 có ba số, v.v.
- Vấn đề Langford của bậc n yêu cầu sắp xếp hai bản sao của các số từ 1 đến n sao cho có k số giữa hai số k.
- Vấn đề này có nghiệm nếu và chỉ nếu n congruent với 0 hoặc 3 mod 4.
Westenberg.
The optimized self and the life that got away
- Samuel Smiles xuất bản cuốn sách “Self-Help” vào thế kỷ 19, thúc đẩy ý tưởng rằng nhân cách có thể được phát triển qua nỗ lực chính đáng.
- Trong thập kỷ vừa qua, nhiều người coi cơ thể là một dự án có thể đo lường được.
- Phòng tập gym chuyển từ nơi cảm thấy tốt đến nơi thực hiện các chỉ số sức khỏe.
- Các thảo luận trên các diễn đàn hiện nay tập trung vào cấu trúc xương và thói quen sức khỏe hàng ngày.
- Văn hóa hiện tại quá chú trọng việc cải thiện bản thân mà quên đi ý nghĩa sâu sắc của việc “cải thiện”.
- Max Weber nói về đạo đức lao động của người Protestant, nhấn mạnh rằng thành công vật chất là dấu hiệu của ân sủng thiêng liêng.
- Các tín đồ trên các diễn đàn tối ưu hóa diện mạo như những người theo đạo Calvin, điều đó thể hiện qua việc theo dõi các chỉ số sức khỏe.
- Kinh nghiệm sống bị xem là dữ liệu để tối ưu hóa, làm mất đi ý nghĩa thực sự của trải nghiệm.
- Cuốn tiểu thuyết “Brave New World” của Aldous Huxley phản ánh sự mất mát trong việc trải nghiệm thực sự khi mọi thứ đều được tối ưu hóa.
- Nỗi đau và sự khổ luyện hiện nay được xem như công cụ cải thiện sức khỏe.
- Các trải nghiệm không thể lập kế hoạch hoặc đo lường lại trở nên vô giá trị trong khung tối ưu hóa hiện tại.
- Những cuộc trò chuyện thân mật và thời gian không sản xuất ra kết quả không còn được đánh giá cao bởi tiêu chí của những người chăm sóc sức khỏe hiện nay.
Andrew Nesbitt
Guided Meditation for Developers
- Tìm một vị trí thoải mái và đóng máy tính xách tay lại để giảm ánh sáng màn hình, giữ tiếng quạt hoạt động như một điểm neo.
- Thở sâu và chạy lệnh
npm install, không nhìn vào đầu ra của nó.
- Bắt đầu quét cơ thể, chú ý đến căng thẳng ở đầu, trán, hàm và vai, thả lỏng từng phần.
- Thực hành kỹ thuật thở liên quan đến chu kỳ vòng đời của package: hít vào 4 giây, giữ 7 giây, thở ra 8 giây.
- Đóng mắt và tưởng tượng mình đứng trong một khu vườn, đại diện cho dự án của bạn, với cả cây trồng của bạn và cây khác.
- Khám phá sâu hơn vào khu vườn, nhận ra rằng có nhiều phụ thuộc không được bạn trồng.
- Nhìn xuống đất, thấy có mùi lưu huỳnh từ một phụ thuộc bên trong phức tạp, vẫn hoạt động mặc dù đã lỗi thời.
- Tưởng tượng về một thông báo màu vàng cho biết có 3 lỗ hổng với mức độ nghiêm trọng vừa phải, không mở mắt hoặc chạy
npm audit fix vì sẽ gây ra vấn đề phụ thuộc.
Bert Hubert’s writings
BertVote Gemeenteraadsverkiezingen 2026
- Ngày 18 tháng 3, hầu hết các huyện sẽ tiến hành bỏ phiếu, trừ Hilversum và Wijdemeren.
- Tác giả không thể tiếp tục chiến dịch NerdVote vì là ứng cử viên cho Progressief Pijnacker-Nootdorp.
- Tác giả ủng hộ các ứng cử viên tại Pijnacker-Nootdorp, Katwijk, Nijmegen và Amsterdam.
- Bert Hubert đứng thứ 27 trong danh sách của Pijnacker-Nootdorp.
- Elisabeth IJmker, đứng thứ 6 trong danh sách của Amsterdam, là đại diện cho tư duy số từ năm 2021 và có kế hoạch giảm phụ thuộc vào big tech.
- Tijmen de Vries, đứng thứ 2 ở Katwijk, là một nhà hoạt động năng động trong lĩnh vực kỹ thuật số.
- Joep Bos-Coenraad, đứng thứ 6 ở Nijmegen, đã có kinh nghiệm trong Hội đồng và tập trung vào tự chủ kỹ thuật số.
- Tổ chức có danh sách ứng cử viên từ Mạng lưới Xã hội Số của GroenLinks.
- Tác giả khuyến khích mọi người đi bỏ phiếu, dù không chọn những ứng cử viên này.
Martin Alderson
Why Claude’s new 1M context length is a big deal
- Anthropic phát hành phiên bản Opus 4.6 và Sonnet 4.6 với cửa sổ ngữ cảnh 1 triệu token vào thứ Sáu tuần trước, đánh dấu bước đột phá lớn (số token này tương đương 1.000-2.000 trang văn bản) .
- AI đang cải thiện trên nhiều phương diện như chất lượng, chi phí, tốc độ và chiều dài ngữ cảnh, với những mô hình mới như Qwen 3.5 cho phép sử dụng với chi phí thấp.
- GPT-3.5 có cửa sổ ngữ cảnh 4.096 token vào cuối năm 2022, trong khi hiện tại có mô hình với chiều dài ngữ cảnh 1 triệu token.
- Hiện tượng “context rot” diễn ra khi chất lượng của mô hình giảm theo thời gian, có thể làm mất thông tin đã được cung cấp và nhầm lẫn các khái niệm.
- Benchmark “needle” đo lường khả năng nhớ của mô hình, nhưng có những yếu điểm cần lưu ý.
- Mặc dù GPT-5.4 và Gemini 3.1 Pro đều có cửa sổ ngữ cảnh 1 triệu token, nhưng chất lượng giảm nhanh khi vượt quá 256K token.
- Opus 4.6 1 triệu token tỏ ra hiệu quả cao trong các phiên làm việc dài 500K token, không xuất hiện dấu hiệu quên.
- Cửa sổ ngữ cảnh dài hơn rất hữu ích trong các quy trình làm việc phức tạp, đặc biệt là trong các tác vụ liên quan đến pháp lý cần tham khảo nhiều tài liệu.
- Việc nén thông tin trong mô hình đôi khi dẫn đến khó khăn trong việc duy trì chi tiết quan trọng từ các phần trước đó trong cuộc hội thoại.
- Các tác vụ nghề nghiệp thường không giống nhau trong việc “trích xuất”, điều này khiến cho mô hình gặp khó khi xử lý thông tin phức tạp.
🍵 computers are bad
LotusNotes
- Máy tính có nguồn gốc mạnh mẽ từ quân đội, phục vụ các hợp đồng nghiên cứu quân sự.
- Chiến tranh thế giới thứ hai thúc đẩy sự phát triển của giáo dục đại học ở Mỹ thông qua G.I. Bill.
- Các đổi mới trong chiến tranh, như radar và công nghệ hạt nhân, chủ yếu được phát triển tại các trường đại học hàng đầu như MIT và Stanford.
- Quân đội đầu tư vào giáo dục để cải thiện hệ thống đào tạo quân sự và chuẩn bị cho các chiến dịch chiến tranh kỹ thuật cao.
- PLATO là hệ thống dạy học máy tính đầu tiên, đã bắt đầu từ cuối những năm 1950 và phổ biến vào những năm 1970.
- PLATO được thiết kế để hỗ trợ cộng tác và cho phép giáo viên tạo khóa học tương tác mà không cần nhiều kỹ năng máy tính.
- Mặc dù có nhiều tiềm năng, PLATO không thành công bền vững và gặp khó khăn trong việc thương mại hóa.
- Hệ thống PLATO chủ yếu tồn tại trong mạng lưới các địa điểm của Đại học Illinois và đã suy giảm trong những năm 1980.
Open Source Projects - Latest Discoveries
Anthropic’s original performance engineering take-home now open-sourced
The definitive tool for building AI agents inside Obsidian
The definitive tool for AI-driven analysis of A-share and US markets
Turn your raw video into a viewable 3D Gaussian Splat on macOS
The open-source engine for your 24/7 autonomous AI workforce
Turn your computer into a streaming hub with every source available
Turn Claude Code into a self-improving agentic coding system
Customizable “Toast-like” Notification via openCustomDialog (Font Size & Panel Size)
Montana Made Computation a Constitutional Right. Devs Are Split.
[Boost]
RLAAS (Rate Limiting As A Service): Rate Limiting Across Modern Systems
AI Integration in Workplaces Causes Burnout: Strategies to Mitigate Overwork and Protect Employee Well-being
How I synced real-time CS2 predictions with Twitch stream delay
SQL Injection – with filter bypass via XML encoding | PortSwigger Lab Note #11
How to build a Next.js SEO pipeline with programmatic content
Feedback Loops: The Quiet Force Shaping AI System Behavior
Governance Drift: The Hidden Failure Mode of AI Systems
How to Detect Education Sentiment Anomalies with the Pulsebit API (Python)
Designing a Cloud Architecture from Scratch: My CCF501 Assessment 1
Hacker News: Best
💬 Canada’s bill C-22 mandates mass metadata surveillance of Canadians
🔥 The 49MB web page
🔥 Chrome DevTools MCP
🔥 Office.eu launches as Europe’s sovereign office platform
💬 LLM Architecture Gallery
🔥 Ask HN: How is AI-assisted coding going for you professionally?
💬 Separating the Wayland compositor and window manager
🔥 Glassworm Is Back: A New Wave of Invisible Unicode Attacks Hits Repositories
🔥 Harold and George Destroy the World
🔥 I’m 60 years old. Claude Code killed a passion