daily-digest

Simon Willison’s Weblog

Anti-patterns: things to avoid

Hành vi đưa mã không được xem xét cho người khác là một anti-pattern thường gặp trong kỹ thuật agentic.
Không mở pull request với mã mà bạn chưa tự xem xét (tối thiểu là hàng trăm hoặc hàng nghìn dòng từ agent).
Nếu không tự đảm bảo mã hoạt động, bạn đang giao phó công việc cho người khác.
Bạn cần tự tin rằng mã sẵn sàng để người khác xem xét; trách nhiệm kiểm tra ban đầu là của bạn.
Pull request tốt trong agentic engineering có các đặc điểm: mã hoạt động tốt và bạn tự tin về chức năng của nó.
Thay đổi phải đủ nhỏ để dễ dàng xem xét mà không gây quá tải cho reviewer; vài PR nhỏ hơn thì tốt hơn một PR lớn.
Pull request cần có ngữ cảnh bổ sung để giải thích thay đổi và liên kết đến các vấn đề hoặc đặc điểm liên quan.
Tiêu đề và mô tả của pull request cần được xem xét kỹ lưỡng; không nên kỳ vọng người khác đọc mà bạn chưa kiểm tra.
Cung cấp bằng chứng bạn đã nỗ lực kiểm tra mã, như ghi chú thử nghiệm, bình luận về lựa chọn triển khai hoặc tài liệu hình ảnh về tính năng hoạt động.

Something is afoot in the land of Qwen

Ngày 4 tháng 3 năm 2026, Junyang Lin, nhà nghiên cứu chủ chốt của Qwen, công bố từ chức.
Lin Junyang có vai trò quan trọng trong việc phát triển các mô hình open weight của Alibaba kể từ năm 2024.
Việc từ chức diễn ra sau một cuộc tái cơ cấu trong Alibaba, nơi một nhà nghiên cứu mới từ đội ngũ Google Gemini được bổ nhiệm làm lãnh đạo Qwen (chưa được xác nhận).
Nhiều thành viên chủ chốt khác của Qwen cũng thông báo từ chức, bao gồm Binyuan Hui và Bowen Yu, những người chịu trách nhiệm phát triển các mô hình Qwen.
Qwen 3.5 được coi là một trong những mô hình xuất sắc nhất, ra mắt với nhiều kích cỡ, bắt đầu từ Qwen3.5-397B-A17B vào ngày 17 tháng 2.
Mô hình nhỏ nhất, 2B, chỉ có dung lượng 4.57GB và là một mô hình reasoning và multi-modal hoàn chỉnh.
Sự ra đi của các thành viên chủ chốt có thể ảnh hưởng đến triển vọng của Qwen trong tương lai.

The Pragmatic Engineer

Building Claude Code with Boris Cherny

Boris Cherny vận hành 5 phiên bản Claude song song, thực hiện 20-30 PR mỗi ngày.
Chất lượng mã có ảnh hưởng lớn đến năng suất kỹ thuật, tăng từ 10% trở lên (Meta).
Tìm kiếm “agentic” của Claude Code chủ yếu dựa vào glob và grep, vượt trội hơn RAG.
Boris tự động hóa quy trình đánh giá mã để giảm thời gian dành cho việc này.
Tất cả nhân viên tại Anthropic đều có cùng chức danh - “Member of Technical Staff”, nhằm khuyến khích sự hợp tác đa dạng.
Claude Cowork được phát triển trong khoảng 10 ngày và tăng trưởng nhanh chóng.
Nhóm Claude Code thay thế tài liệu yêu cầu sản phẩm bằng việc tạo ra nhiều nguyên mẫu hoạt động để phát triển tính năng.
Năm nay được coi là năm của người tổng hợp và những người có ADHD, văn hóa làm việc chuyển từ tập trung sâu sang quản lý nhiều tác vụ song song.

Martin Fowler

Humans and Agents in Software Engineering Loops

Con người cần tham gia vào quá trình phát triển phần mềm để quản lý vòng lặp và tập trung vào kết quả, không chỉ để giám sát từng dòng mã (nguồn: ý kiến cá nhân).
Vòng lặp “why” tập trung vào việc biến ý tưởng thành sản phẩm phần mềm hoạt động, trong khi vòng lặp “how” liên quan đến cách xây dựng phần mềm qua các artefacts trung gian như mã, kiểm thử, và tài liệu (nguồn: phân tích quy trình).
Vòng lặp “how” bao gồm nhiều vòng nhỏ hơn, với vòng ngoài xác định và cung cấp phần mềm hoạt động cho vòng “why” (nguồn: mô hình quy trình).
Các phương pháp như kiểm tra thiết kế và quy trình kiểm thử giúp tổ chức các vòng lặp này để đạt được kết quả cuối cùng mong muốn (nguồn: thực tiễn phát triển).
Nhiều người đã trải nghiệm việc để con người chỉ tập trung vào vòng “why” và để các đối tượng tự xử lý vòng “how”, gọi là “vibe coding” (nguồn: cách tiếp cận hiện tại).
Chất lượng bên ngoài của phần mềm (chạy đúng, không gặp sự cố, hiệu suất) là điều quan trọng hơn nội bộ; LLM có thể tạo mã mà không cần sạch sẽ nếu kết quả vẫn đúng (nguồn: nhận xét về thực tế phát triển).
Khi LLM có thể viết mã phức tạp, có thể ảnh hưởng đến thời gian và chi phí phát triển sản phẩm (nguồn: phân tích hậu quả của mã không sạch).
Một mã code sạch giúp LLM hiểu và sửa đổi nhanh hơn, ít spiraling hơn, cải thiện hiệu suất phát triển (nguồn: lợi ích thực tiễn).

Daring Fireball

★ Thoughts and Observations on the MacBook Neo

Giá của MacBook Neo là 599 USD, thấp hơn đáng kể so với những sản phẩm Mac khác.
MacBook Neo có cấu hình cơ sở với Touch ID và 256 GB bộ nhớ, có tùy chọn 512 GB với giá 699 USD.
Apple áp dụng mức giá giáo dục, giảm còn 499 USD cho học sinh và sinh viên.
Ông John Ternus khẳng định rằng một nửa người mua Mac mới là người mới lần đầu sử dụng.
MacBook Neo có thiết kế và chất lượng tốt, với vỏ nhôm, bàn phím và trackpad được đánh giá cao.
Màn hình của MacBook Neo đạt độ sáng tối đa 500 nits, cùng chất lượng âm thanh vượt trội.
Đây là sản phẩm Mac mới nhất nhắm vào thị trường tiêu dùng trong thời đại Apple Silicon.
MacBook Neo hoàn toàn mới, không phải chỉ là phiên bản cũ với giá rẻ hơn.
Thiết kế trackpad và màn hình khác biệt so với MacBook Air cũ, chỉ hỗ trợ gam màu sRGB.

Studio Display vs. Studio Display XDR

Màn hình Studio Display mới kích thước 27 inch với độ phân giải 5K Retina, có camera và âm thanh, hỗ trợ Thunderbolt 5.
Màn hình Studio Display XDR tiên tiến với độ sáng HDR tối đa 2000 nits và tần số làm tươi 120Hz.
Cả hai màn hình đều có độ phân giải 5120 x 2880 pixels và 218 ppi.
Studio Display có điểm sáng tối đa 600 nits, còn Studio Display XDR có điểm sáng tối đa 1000 nits SDR.
Cả hai màn hình đều sử dụng công nghệ True Tone, lớp chống phản chiếu, và có tùy chọn kính nano-texture.
Cả hai màn hình đều trang bị camera Center Stage 12MP và hệ thống âm thanh với ba mic và sáu loa.
Mỗi màn hình có hai cổng USB-C và một cổng Thunderbolt 5 cho kết nối và sạc.

Compatibility Notes on the New Studio Displays

Các mẫu Studio Display và Studio Display XDR không tương thích với Mac sử dụng chip Intel (Apple).
Studio Display tương thích với các Mac từ năm 2020 trở đi, tất cả đều sử dụng chip M-series.
Danh sách các Mac tương thích bao gồm: 16-inch MacBook Pro (2021 trở lên), 14-inch MacBook Pro (2021 trở lên), 13-inch MacBook Pro (M1, 2020 trở lên), 15-inch MacBook Air (2023 trở lên), 13-inch MacBook Air (M1, 2020 trở lên), Mac Studio (2022 trở lên), Mac mini (2020 trở lên), Mac Pro (2023 trở lên), và 24-inch iMac (2021 trở lên).
Apple bắt đầu loại bỏ các Macs sử dụng chip Intel từ năm 2020 với các thiết bị đầu tiên có silicon của Apple.
Các macOS cập nhật dành cho Intel Macs sẽ dừng lại ở phiên bản macOS Tahoe, và Intel Macs sẽ không nhận được macOS 27.
Apple sẽ cung cấp các bản cập nhật bảo mật cho Intel Macs trong ba năm tới.
Studio Display và Studio Display XDR sẽ được mở đặt hàng trước vào lúc 9:15 a.m. Eastern Time ngày 4 tháng 3.

‘In Other Words, Batman Has Become Superman and Robin Has Become Batman’

Apple đã đổi tên các lõi CPU mạnh nhất từ “performance cores” thành “super cores” trong các mẫu MacBook Pro M5 Pro và M5 Max.
Các thiết bị như M5 MacBook Pro, M5 iPad Pro và M5 Vision Pro cũng được retroactively đổi tên thành “super cores” (2023).
M5 Pro và M5 Max giới thiệu thiết kế lõi mới, với lõi hiệu suất được cải thiện cho các tác vụ đa luồng.
Apple nhấn mạnh hiệu suất của các lõi này, trước đây được xem là lõi tiết kiệm năng lượng.
Apple hy vọng thay đổi tên gọi sẽ cải thiện nhận thức về hiệu suất của các lõi cấp thấp hơn.
Thiết kế lõi mới cung cấp khả năng tiết kiệm năng lượng nhưng mạnh mẽ hơn cho các tác vụ nặng.
Kiến trúc Fusion mới cho phép Apple kết hợp các “chiplets” khác nhau trong một gói, tạo sự linh hoạt hơn trong thiết kế chip (2023).

iDiallo.com

Interruption-Driven Development

Nghe nhạc trong khi làm việc khiến tôi khó tập trung và thường phải tạm dừng tab phát nhạc.
Tôi đeo tai nghe để ngăn chặn sự nhòm ngó của người khác, mặc dù điều này không hoàn toàn hiệu quả.
Sự gián đoạn trong công việc gây khó khăn khi tôi đang cố gắng tập trung vào một tác vụ cụ thể.
Cuộc trò chuyện ngắn với đồng nghiệp thường khiến tôi mất mạch suy nghĩ và phải xây dựng lại quá trình tư duy.
Làm việc từ xa có thể giảm bớt gián đoạn, nhưng không thể tránh khỏi các cuộc họp.
Người quản lý thường kéo nhân viên vào các cuộc họp không cần thiết khiến họ không thể hoàn thành công việc.
Thời gian họp giảm không phải là giải pháp; ba cuộc họp mỗi ngày vẫn dẫn đến ba lần gián đoạn.
Sự gián đoạn liên tục làm giảm khả năng tập trung và hiệu suất làm việc, giống như hoàn cảnh ở bệnh viện nơi không có thời gian nghỉ ngơi thật sự.
Môi trường làm việc cần tạo điều kiện cho sự tập trung liên tục, không bị gián đoạn.

🍵 Maurycy’s Blog

Remove annoying banners

Đoạn mã JavaScript này xóa phần tử phiền phức trên trang web.
Hàm cleanup xóa các phần tử có thuộc tính vị trí “fixed”, “sticky”, “hidden”, và “clip”.
Nó cũng kích hoạt lại chế độ cuộn cho các phần tử bị vô hiệu hóa (overflow).
Đoạn mã chạy cho tất cả phần tử trên trang bằng cách sử dụng document.querySelectorAll('*').forEach(cleanup).
Người dùng có thể lưu đoạn mã vào thanh bookmark để sử dụng dễ dàng hơn.
Đoạn mã “Force dark mode” chuyển màu chữ thành trắng và nền thành đen.
Đoạn mã “Force light mode” chuyển màu chữ thành đen và nền thành trắng.

Terence Eden’s Blog

How many hours do you need to work to afford a pint of beer?

Giá hai pint bia tại London khoảng 12 bảng (12 quid).
Giá bia khi tác giả còn là sinh viên khoảng 2 bảng cho mỗi pint.
Lương tối thiểu khi đó là 4 bảng mỗi giờ, tương ứng khoảng 30 phút làm việc cho một pint bia.
Hiện nay, lương tối thiểu khoảng 12 bảng mỗi giờ, với giá pint bia là 6 bảng, cũng khoảng 30 phút làm việc.
Dữ liệu lịch sử của giá bia được duy trì bởi Văn phòng Thống kê Quốc gia UK.
Giá trung bình của bia hiện tại khoảng 5 bảng, so với 2 bảng khi tác giả học đại học.
Tỷ lệ giữa giá bia và lương tối thiểu khá ổn định, từ 27 đến 40 phút.
Hiện tại, bia lager rẻ hơn so với lương tối thiểu hơn bất kỳ thời điểm nào trước đây.

Game Review: Unravel Two ★★★⯪☆

Nghị quyết năm mới của tôi là chơi nhiều video game hơn, đặc biệt là game hợp tác.
Tôi không thích chơi cạnh tranh; nó không đáng để chiến thắng trên sự tổn thương của người khác.
Tôi đã chọn Unravel Two, một trò chơi 2D platform puzzler chơi theo cặp.
Trong game, hai người điều khiển các sinh vật làm từ dây và phải hợp tác để vượt qua các chướng ngại vật.
Gameplay có cơ chế vật lý cổ điển, dễ học nhưng cũng hạn chế ở số cách giải quyết cho mỗi phần.
Game khuyến khích giao tiếp giữa người chơi với các câu lệnh hợp tác.
Có chế độ chơi một người tạm thời nếu một người không muốn tham gia các bài nhảy.
Câu chuyện trong game về những đứa trẻ gặp rắc rối không cần thiết, làm giảm trải nghiệm.
Các tiêu đề cấp độ có những phụ đề phức tạp không tương xứng với nội dung game.
Game có độ tái chơi cao với việc khám phá nhanh các cấp độ và tìm kiếm vật phẩm bí mật.
Giá bán là 3.51 bảng Anh, rất hợp lý cho một game casual co-op.
Hãy bỏ qua cốt truyện mơ hồ để tận hưởng gameplay vui vẻ.

DYNOMIGHT

Maybe there’s a pattern here?

Richard Gatling phát triển súng với khả năng bắn nhanh, giúp một người thực hiện nhiệm vụ chiến đấu của hàng trăm người (1861).
Hermann Oberth xuất bản “The Rocket to Planetary Spaces” vào năm 1923, đề xuất khả năng du hành vũ trụ và phát triển tên lửa nhiều giai đoạn (1923).
Verein für Raumschiffahrt (VfR) được thành lập năm 1927 tại Đức, nhanh chóng có hàng trăm thành viên và tiến hành phát triển tên lửa (1927).
VfR tiến hành thử nghiệm tên lửa ở một bãi đạn cũ gần Berlin và phát triển nhiều loại tên lửa mạnh hơn trong những năm tiếp theo (1930).
Khủng hoảng kinh tế khiến VfR gặp khó khăn về tài chính và uy tín, dẫn đến việc từ chối hợp tác với quân đội (1932).
Sau khi Adolf Hitler lên nắm quyền, quân đội đề nghị tiếp quản VfR nhưng bị từ chối và nghiên cứu dân sự về tên lửa bị hạn chế (1933).
Max Valier mất trong một tai nạn năm 1930; Johannes Winkler gia nhập SS và Willy Ley di cư sang Mỹ, phát triển khoa học phổ thông (1944).
Alberto Santos-Dumont được coi là người phát minh máy bay, nhưng cũng có quan điểm quân sự về ứng dụng của máy bay trong chiến tranh (1904).
Ông tham gia quân đội Pháp trong WWI nhưng thấy sự sử dụng máy bay gây tăng cường bạo lực và do đó về nước (1916).
Santos-Dumont đã kêu gọi Liên đoàn Quốc tế cấm sử dụng máy bay làm vũ khí và cảm thấy hối tiếc về phát minh của mình (1932).

The Old New Thing

Aha, I found a counterexample to the documentation that says that QueryPerformanceCounter never fails

QueryPerformanceFrequency không trả về FALSE, và QueryPerformanceCounter không trả về zero trên hệ thống chạy Windows XP trở lên.
Hàm có thể thất bại với mã lỗi ERROR_NOACCESS nếu biến không được căn chỉnh double-word (8-byte).
Tài liệu giả định rằng tham số đầu vào là hợp lệ và cho phép ghi vào cấu trúc LARGE_INTEGER.
Tham số không được là con trỏ null, không phải con trỏ đến bộ nhớ chưa được phân bổ, và không được ghi vào trong khi QueryPerformanceCounter đang chạy.
Cấu trúc LARGE_INTEGER yêu cầu căn chỉnh 8-byte do cấu trúc mặc định trên Windows.
Việc truyền tham số không hợp lệ có thể gây ra kết quả không thể đoán trước, bao gồm cả việc trả về thất bại hoặc kết quả không đáng tin cậy.
Tài liệu được cập nhật để khẳng định rằng trên hệ thống Windows XP trở lên, hàm sẽ luôn thành công với các tham số hợp lệ và không bao giờ trả về zero.

John D. Cook

From logistic regression to AI

Neural networks có thể coi là logistic regression với nhiều tham số hơn, nhất là với quy mô lớn (LLMs).
Logistic regression hoạt động tốt trên các tập dữ liệu nhỏ; một mẫu mô hình đã được cấp bằng sáng chế.
Một số mô hình thử nghiệm lâm sàng được phát triển tại MD Anderson dựa trên Bayesian logistic regression, dùng cho các thử nghiệm quy mô nhỏ.
Số tham số tối ưu cho một mô hình phụ thuộc vào kích thước tập dữ liệu; quy tắc thực hành là cần ít nhất 10 sự kiện cho mỗi tham số.
Mô hình với 200 bệnh nhân có thể sử dụng tối đa bốn tham số, nhưng cần kiểm tra xem dữ liệu có đủ sức chứng minh cho các tham số đó không.
Trong khi dùng logistic regression, hệ số tham số và kiểu biến thường đơn giản; nhưng LLMs sử dụng token và tham số kiểu số phức tạp hơn.
Tỷ lệ giữa bit dữ liệu và bit tham số giữa logistic regression và LLMs tương tự nhau, điều này gây bất ngờ.

An AI Odyssey, Part 2: Prompting Peril

Việc sử dụng OpenAI API có thể ảnh hưởng đến độ chính xác của phản hồi từ API.
Câu hỏi về việc cải thiện độ chính xác phản hồi đã nhận được hai câu trả lời khác nhau từ hai phiên bản ChatGPT.
Sự khác biệt trong câu trả lời có thể do cách đặt câu hỏi, hướng dẫn cá nhân hóa tài khoản, và lịch sử cuộc trò chuyện.
Các mô hình ngôn ngữ lớn là hệ thống xác suất có điều kiện, không đảm bảo khả năng tái sản xuất với cùng một đầu vào.
Đầu ra của mô hình phụ thuộc vào cách đặt câu hỏi, nội dung của cửa sổ ngữ cảnh, và cấu hình mô hình.
Sự khác biệt nhỏ trong các đầu vào có thể tạo ra các đầu ra khác biệt lớn.
Cách mà chatbot AI phản hồi có thể ảnh hưởng lớn đến hiệu quả của công cụ trong dự án.
Cần có sự kiên trì và linh hoạt trong việc tìm kiếm câu trả lời đáng tin cậy từ các công cụ AI mới.

Andrew Nesbitt

Package Managers Need to Cool Down

Seth Larson yêu cầu phân tích cooldown phụ thuộc giữa các package manager.
Tất cả các công cụ nên hỗ trợ cấu hình toàn cầu exclude-newer-than= như 7d.
Tấn công chuỗi cung ứng thường xảy ra khi kẻ tấn công phát hành phiên bản mã độc của package trong thời gian ngắn.
William Woodruff khuyến nghị cooldown phụ thuộc để ngăn chặn cài đặt phiên bản mới của package cho đến khi nó tồn tại trên registry một thời gian nhất định (tháng 11 năm 2025).
Tám trong mười cuộc tấn công mà Woodruff phân tích có khoảng thời gian dưới một tuần, vì vậy một cooldown 7 ngày sẽ ngăn chặn hầu hết các cuộc tấn công này.
Hệ sinh thái JavaScript đã áp dụng cooldown nhanh chóng, với các phiên bản pnpm và Yarn hỗ trợ tính năng này vào tháng 9 năm 2025.
Python cũng bắt đầu hỗ trợ tính năng cooldown với uv và pip, nhưng không nhất quán.
Ruby chưa có hỗ trợ natively nhưng gem.coop cung cấp dịch vụ cooldown cho gems mới xuất bản.
Cargo (Rust) đã có RFC cho cooldown và dự kiến phát hành vào tháng 3 năm 2026.
Các công cụ cập nhật phụ thuộc như Renovate và Dependabot đã tích hợp tính năng cooldown trong cấu hình của họ.
Snyk có cooldown không cấu hình được là 21 ngày cho các PR nâng cấp tự động.
Công cụ kiểm tra cấu hình như zizmor đã thêm quy tắc kiểm tra để phát hiện thiếu sót trong thiết lập cooldown của Dependabot.

The Silicon Underground

Homebrew Computer Club in Menlo Park

Homebrew Computer Club thành lập tại Menlo Park, California vào ngày 5 tháng 3 năm 1975.
Các thành viên nổi bật bao gồm Steve Wozniak, Steve Jobs, Harry Garland, và John Draper.
Câu lạc bộ hoạt động từ tháng 3 năm 1975 đến tháng 12 năm 1986, gặp mặt hàng tháng.
Cuộc họp đầu tiên tập trung vào microcomputer MITS Altair 8800, mà Steve Wozniak lấy cảm hứng để thiết kế Apple I.
Cuộc họp diễn ra trong garage của Gordon French và Fred Moore là người sáng lập.
Câu lạc bộ tham gia vào vụ đánh cắp phần mềm đầu tiên với Altair Basic vào tháng 6 năm 1975.
Dù vậy, Microsoft sau đó đã thương lượng doanh thu từ Basic để bảo vệ lợi ích.
Hầu hết các thành viên ban đầu tiếp tục gặp nhau trong 6800 Club sau này.
Câu lạc bộ gặp gỡ tại nhiều địa điểm như Peninsula School và Stanford Medical School.
The Oasis, một địa điểm gặp gỡ khác, đóng cửa vào tháng 3 năm 2018 do giá thuê cao.
Có tranh luận về việc liệu ngành công nghiệp máy tính hiện đại bắt nguồn từ Menlo Park hay Texas, nơi có Datapoint 2200.
David Farquhar là tác giả viết về máy tính từ năm 1991 và chuyên về quản lý lỗ hổng từ năm 2013.

Martin Alderson

Why on-device agentic AI can’t keep up

AI chạy trên thiết bị cá nhân giúp bảo mật, giảm độ trễ và không tốn phí API.
Hiệu năng cải tiến của mô hình open weights ấn tượng trên phần cứng mạnh, nhưng đa số thiết bị vẫn không đủ khả năng.
Laptop phổ biến hiện nay thường có 16GB RAM, trong khi smartphone chủ yếu sử dụng 8GB RAM (iPhone 16e/17) hoặc 12GB trên các model Pro.
RAM cần thiết không chỉ để chạy AI mà còn cho hệ điều hành và ứng dụng, dẫn đến không đủ không gian cho AI.
Mô hình AI 3B tham số yêu cầu khoảng 2GB RAM, trong khi mô hình 7B yêu cầu 5GB, không phù hợp với thiết bị tiêu dùng mới.
Bớt không gian cho các tác vụ agentic do yêu cầu bộ nhớ cache cho các tương tác với mô hình.
Tối thiểu cần 32K tokens cho các tác vụ agentic cơ bản, tương đương với 16GB RAM cho phần AI.
Các kỹ thuật giảm bớt không gian bộ nhớ như grouped-query attention và quantised KV caches hiện có nhưng chưa đủ hiệu quả.
Giá RAM đã tăng hơn 300%, khiến các nhà sản xuất có xu hướng giảm dung lượng RAM thay vì tăng.
Các loại RAM như HBM và DDR5 cạnh tranh nguồn cung, ảnh hưởng đến khả năng nâng cấp bộ nhớ trên thiết bị tiêu dùng.

Using OpenCode in CI/CD for AI pull request reviews

Hầu hết các công cụ AI code review hiện tại yêu cầu truy cập vào kho lưu trữ GitHub hoặc GitLab (nguồn xác định).
Việc cấp quyền truy cập kho cho bên thứ ba có thể gây rủi ro cho an ninh.
OpenCode là một lựa chọn thay thế mở, sử dụng Codex 5.3 với ChatGPT Plus hoặc Team subscription.
Thiết lập pipeline cho OpenCode với các hệ thống CI/CD dựa trên YAML rất đơn giản.
Các bước trong pipeline bao gồm: clone repo, cài đặt OpenCode, copy file cấu hình auth.json, và gửi prompt để đánh giá PR.
Đầu ra sẽ được đăng lại dưới dạng bình luận trong PR thông qua API của Git provider.
Mặc dù OpenCode gửi mã đến OpenAI API cho phép suy diễn, bạn vẫn kiểm soát mã nguồn của mình.
So với các sản phẩm SaaS code review khác, OpenCode không tính phí theo người dùng hoặc theo tính năng, giảm chi phí cho các đội ngũ.
Bằng cách sử dụng OpenCode, bạn không cần cấp OAuth cho bên thứ ba, làm giảm bề mặt tấn công.
Kết quả từ OpenCode có thể chất lượng cao với những điểm mấu chốt về hiệu suất và bảo mật được kiểm tra kỹ lưỡng.
Bạn có thể tùy chỉnh đầu vào và thêm thông tin về ticket trong OpenCode theo yêu cầu dự án.
Sử dụng công cụ như OpenCode cho phép thay thế các công cụ chuyên ngành trong khi giữ được sự kiểm soát đối với mã nguồn của bạn.

Which web frameworks are most token-efficient for AI agents?

Nghiên cứu tìm hiểu xem các web frameworks nào là hiệu quả nhất trong việc viết mã.
19 web frameworks được chọn, bao gồm các framework quen thuộc như Express.js, Django và Spring Boot.
Yêu cầu xây dựng một ứng dụng blog đơn giản với các tính năng cơ bản.
Tất cả các frameworks đều sản xuất ra blog hoạt động mà không gặp lỗi rõ ràng.
Các framework Mininal như ASP.NET Minimal API hiệu quả nhất với 26k tokens, trong khi Phoenix tốn tới 74k tokens.
Các framework đầy đủ tính năng như SvelteKit và Django cũng thuộc top hiệu quả nhất.
Model có xu hướng tốn nhiều tokens hơn với các framework ít phổ biến hơn.
Thí nghiệm tiếp theo yêu cầu thêm tính năng để xem sự thay đổi về hiệu quả.
Tất cả trừ Spring Boot đều thực hiện thành công nhiệm vụ thêm tính năng.
Tỷ lệ thành công cao với 18/19 framework hoàn thành nhiệm vụ như mong muốn.

Who fixes the zero-days AI finds in abandoned software?

Nghiên cứu của nhóm red team Anthropic chỉ ra Claude Opus 4.6 tìm thấy hơn 500 lỗi nghiêm trọng trong các dự án mã nguồn mở, một số đã tồn tại hàng thập kỷ và chưa được phát hiện.
Nghiên cứu này tập trung vào các phần mềm được duy trì, nơi có thể vá lỗi, trong khi phần mềm bỏ quên có nguy cơ lớn hơn.
Có khoảng 40 năm phần mềm internet hỗ trợ, nhiều phần mềm không được hỗ trợ hoặc có độ trễ lớn trong việc vá lỗi bảo mật.
Các lỗ hổng bảo mật nghiêm trọng trước đây cần thời gian của con người để khám phá, nhưng hiện nay có thể bị phát hiện nhanh chóng bởi AI.
Trong thử nghiệm, Claude phát hiện lỗ hổng RCE hoàn toàn trong 4-5 phút sau khi được hướng dẫn.
Tác giả nhận định có hàng ngàn máy chủ dễ bị tổn thương, chủ yếu trên VPS, với nguy cơ cao liên quan đến dữ liệu nhạy cảm.
AI có thể tự động tìm và khai thác lỗ hổng bằng cách hoàn tất quy trình trong môi trường ảo, tạo ra hàng loạt lỗ hổng RCE trong một thời gian ngắn.
Việc phát hiện lỗ hổng hiện tại đã làm thay đổi cách nhìn nhận về an ninh thông tin, khi mà trước đây cần thời gian để phát hiện.
Nỗ lực hạn chế nghiên cứu an ninh bảo vệ từ các phòng lab AI đã bị vượt qua dễ dàng bằng cách giả mạo yêu cầu vá lỗi.
Các rào cản bảo vệ chưa chắc có hiệu quả, vì rất khó để phân biệt giữa nghiên cứu bảo mật tấn công và phòng thủ.

Attack of the SaaS clones

Tôi đã sao chép hầu hết chức năng cốt lõi của Linear trong 20 prompt sử dụng Claude Code (tốn vài triệu tokens).
AI agents đang thay thế SaaS, doanh nghiệp sẽ xây dựng phiên bản “nội bộ” thay vì thuê các nhà cung cấp bên ngoài.
Các agent có khả năng thay thế hoàn toàn nhiều phần mềm năng suất và phân tích, đe dọa giá trị của SaaS hiện tại.
Tệ hơn, các nhà đầu tư PE có thể gặp rủi ro vì nhiều công ty SaaS hiện đang nợ dựa trên doanh thu dự kiến.
Doanh nghiệp có thể không muốn quản lý SaaS nội bộ, nhưng có nhiều cá nhân sẵn sàng tạo ra và cung cấp các nền tảng cạnh tranh với chi phí thấp hơn.
Tôi đã xây dựng một bản sao Linear thông qua quá trình đảo ngược kỹ thuật từ các theo dõi mạng mà không cần mã nguồn.
Từ một tệp HAR ghi lại các yêu cầu mạng, tôi đã sử dụng Claude Code để tái tạo chức năng và thiết kế của phần mềm, tạo ra một sản phẩm hoạt động với cơ sở dữ liệu SQLite.
Quá trình này không hoàn hảo nhưng chứng minh rằng việc sao chép một dự án có thể thực hiện dễ dàng và nhanh chóng với AI.

How to generate good looking reports with Claude Code, Cowork or Codex

Tất cả tổ chức đều có hướng dẫn thương hiệu nhưng thường không được tuân theo trong tài liệu nội bộ.
Bạn có thể tự động hóa quá trình này bằng cách sử dụng Node.js và các prompt thiết kế.
Bước đầu tiên là trích xuất các token thương hiệu từ trang web tổ chức của bạn.
Sử dụng lệnh cURL để tải về và trích xuất các màu sắc, kiểu chữ, khoảng cách và logo, sau đó tạo file design-system.html.
Bước tiếp theo là tạo hai mẫu tài liệu HTML: report-template.html và slides-template.html.
Mẫu report-template.html có kích thước A4, bao gồm trang bìa, tiêu đề, số trang và nội dung có định dạng.
Mẫu slides-template.html có tỷ lệ 16:9, với nhiều loại slide khác nhau cho từng phần nội dung.
Cuối cùng, viết script Node.js để chuyển đổi markdown thành PDF bằng Puppeteer.
Script render.js nhận đầu vào là một file markdown và tạo PDF từ mẫu đã định.
Bạn cần cài đặt các thư viện cần thiết và kiểm tra với file markdown mẫu về trạng thái nhiệm vụ của NASA.
Kết quả là hai file PDF đẹp mắt cho báo cáo và bài thuyết trình.

Self-improving CLAUDE.md files

Sử dụng tệp CLAUDE.md hoặc AGENTS.md giúp cải thiện khả năng của công cụ như Claude Code/Cowork và Codex bằng cách cung cấp ngữ cảnh cho dự án.
Việc giữ các tệp này cập nhật trở nên khó khăn khi dự án phức tạp hơn, và quá trình thủ công rất tốn thời gian.
Sử dụng nhật ký của agent để xác định các vấn đề phổ biến với tệp CLAUDE.md giúp tiết kiệm thời gian.
Claude Code lưu trữ nhật ký trong ~/.claude/projects, trong khi Codex lưu trữ nhật ký trong ~/.codex/sessions.
Nhật ký agent ở định dạng JSONL nhưng có cấu trúc khác nhau giữa hai công cụ.
Gợi ý truy vấn như “xin vui lòng tìm trong lịch sử jsonl của tôi cho dự án này và phân tích cải tiến cho tệp claude.md hiện tại” rất hiệu quả.
Tạo CLI để tìm kiếm nhật ký giúp tăng tốc quy trình, giảm thời gian từ vài phút xuống vài giây.
CLI đã được mã nguồn mở trên GitHub với nhị phân đã xây dựng sẵn cho Mac và Linux.
Kiểm tra đề xuất từ nhật ký nhanh giúp cải tiến tệp CLAUDE.md dễ dàng hơn.
Cần sự hỗ trợ từ Anthropic trong việc áp dụng AGENTS.md để giảm bớt sự phức tạp trong quá trình viết.

Wall Street just lost $285 billion because of 13 markdown files

Ngày 3 tháng 2 năm 2026, $285 tỷ bị xóa sổ khỏi giá trị thị trường của các công ty công nghệ do sự ra mắt của một công cụ pháp lý từ Anthropic (CNBC, CNN).
Công cụ pháp lý được đề cập là một bộ tệp markdown trên GitHub và có kích thước khoảng 156KB, dẫn đến việc mất gần $1 triệu giá trị cho mỗi byte markdown.
Xu hướng này cho thấy SaaS đang gặp khó khăn nghiêm trọng trước các công cụ agentic có thể tái tạo phần mềm (tình huống quan sát).
Công cụ agentic cho phép người dùng chỉ cần yêu cầu thay vì sử dụng UI với nhiều nút bấm để thực hiện nhiệm vụ.
Các sản phẩm SaaS truyền thống, như phần mềm đánh giá pháp lý, đang bị ảnh hưởng bởi các công cụ agentic.
Một vài nền tảng SaaS thuế không thể trả lời các câu hỏi chi tiết như công cụ agentic, tập trung vào tự động hóa quy trình.
Một số nhà cung cấp SaaS vẫn còn có lợi thế, đặc biệt là những hệ thống lưu trữ dữ liệu giao dịch kế toán.
Hệ thống dữ liệu có thể cung cấp quyền truy cập hiệu quả cho các agent, cho phép tạo báo cáo và dashboard nhanh chóng.
Một số nền tảng cũ có API hạn chế, gây khó khăn cho việc tích hợp sử dụng agentic.
Các công ty có thể sẽ cần chuyển đổi khỏi các nhà cung cấp không đáp ứng đủ khả năng truy cập chương trình mà khách hàng yêu cầu.
Người chiến thắng trong tương lai có thể sẽ là các nền tảng headless, hỗ trợ tích hợp hiệu quả hơn với các agentic.

Two kinds of AI users are emerging. The gap between them is astonishing.

Có hai loại người dùng AI: “power users” và người chỉ chat với ChatGPT.
“Power users” thường không phải là người có kiến thức kỹ thuật nhưng vẫn sử dụng AI để giải quyết các nhiệm vụ không liên quan đến lập trình.
Copilot của Microsoft không hiệu quả và bị coi là bản sao kém của ChatGPT.
Microsoft vẫn triển khai Claude Code cho nhân viên bất chấp việc có Copilot với chi phí thấp.
Copilot là công cụ AI duy nhất được phép sử dụng trong doanh nghiệp, gây rủi ro cho nhiều tổ chức.
Chính sách IT doanh nghiệp thường hạn chế, không cho phép chạy các công cụ AI tiên tiến.
Môi trường doanh nghiệp thường bị khóa chặt và không có API nội bộ cho các quy trình làm việc chính.
Các phòng kỹ thuật thường tách biệt và có thể bị thuê ngoài, làm giảm khả năng xây dựng hạ tầng cho AI.
Các công ty nhỏ không gặp phải những hạn chế này, và sử dụng AI hiệu quả hơn.
Những người không có kiến thức kỹ thuật tại các công ty nhỏ có thể nhanh chóng nâng cao năng suất bằng AI như Claude Code.
Việc chuyển đổi mô hình tài chính từ Excel sang Python với Claude Code mang lại lợi ích lớn cho các nhà quản lý.
Nhân viên tại các công ty nhỏ ngày càng sản xuất nhiều hơn so với đồng nghiệp tại các doanh nghiệp lớn nhờ vào AI.

Turns out I was wrong about TDD

Tôi từng là người hoài nghi về TDD vì cảm thấy việc viết test tốn thời gian cho những tính năng có thể không được sử dụng.
Tôi đã sử dụng nhiều loại project khác nhau và chủ yếu dùng e2e testing kết hợp với TestContainers để kiểm tra toàn bộ ứng dụng.
Unit testing chỉ được áp dụng cho các ‘tính toán’ hoặc ‘logic kinh doanh’ cốt lõi, với các project phức tạp hơn yêu cầu nhiều unit tests hơn.
Tôi nhận thấy nhiều lỗi không được phát hiện bởi unit tests, đặc biệt trong các ứng dụng web hoặc mobile phức tạp.
e2e testing chậm do cần khởi động hạ tầng đầy đủ, khởi chạy ứng dụng và chạy thử nghiệm qua trình duyệt.
Tôi từng tin rằng TDD dẫn đến các codebase được tối ưu hóa để dễ kiểm tra nhưng không tập trung vào kết quả sản phẩm.
Đối với phần mềm quan trọng, TDD có thể là lựa chọn đúng đắn nếu yêu cầu sử dụng ổn định và không thay đổi nhiều.
Thay đổi định nghĩa sản phẩm có thể dẫn đến nhiều test cũ bị hủy và cần viết lại nhiều test mới.
Coding agents đã thay đổi cách tiếp cận đến testing, cho phép vận hành nhanh hơn nhưng làm tăng thời gian chờ pass test.
Tôi nhận thấy với Claude Code, tôi thường xuyên phải chờ e2e test, và đầu ra của các bài test này khó hiểu cho LLMs.
Các lỗi nhỏ bắt đầu xuất hiện ngay cả khi test pass, đòi hỏi tôi phải theo dõi liên tục các thay đổi mà coding agent thực hiện.
Mặc dù các mô hình LLM đã được cải thiện nhưng tôi vẫn phải theo dõi rất kỹ output từ Claude Code và log test.

Why sandboxing coding agents is harder than you think

Việc phát triển các coding agents đem lại nhiều lợi ích nhưng cũng gây ra rủi ro bảo mật nghiêm trọng.
Hệ thống quyền hiện tại quá đơn giản, không đủ để ngăn chặn các lệnh “vô hại” thực hiện hành vi có hại (ví dụ: chạy go test có thể xóa tất cả dữ liệu trong thư mục người dùng).
Nhiều công cụ phát triển cho phép các lệnh tăng cường quyền truy cập mà không cần kiểm soát chặt chẽ.
Việc thực hiện tự động hóa trong môi trường không được sandbox (vd: Docker) tạo ra rủi ro bảo mật lớn.
Sử dụng Docker cần cẩn thận, đặc biệt khi cấp quyền superuser cho database có thể dẫn đến các lỗ hổng bảo mật.
Việc sử dụng Docker-in-Docker có thể cấp quyền cao hơn cho host nếu không xử lý cẩn thận.
Các log files từ coding agents có thể chứa thông tin nhạy cảm nếu không được quản lý tốt.
Việc vô tình sao chép và dán thông tin nhạy cảm vào log là một rủi ro phổ biến trong quá trình phát triển.

The Coming AI Compute Crunch

Nhu cầu sử dụng compute cho các ứng dụng AI đang gia tăng mạnh mẽ, có khả năng dẫn đến sự thiếu hụt trong những năm tới.
Sự tiêu thụ token cá nhân đã tăng lên 50 lần trong 3 năm qua, chủ yếu nhờ vào sự cải tiến của các mô hình AI và ứng dụng như Claude Code và Opus 4.5.
Hiện tại có khoảng 1 tỷ người dùng LLM hoạt động, dẫn đến nhu cầu về GPU và TPU để xử lý lượng token khổng lồ.
Các công ty lớn như AWS, Azure và GCP đang đầu tư hàng chục tỷ đô la vào cơ sở hạ tầng để đáp ứng nhu cầu này.
Sự gia tăng chi tiêu capex đã dẫn đến những câu hỏi từ các nhà phân tích tài chính về tính khả thi của các khoản đầu tư khổng lồ này.
Việc triển khai vốn đầu tư hạ tầng gặp nhiều rào cản, đặc biệt là vấn đề năng lượng điện, do nhiều quốc gia đã thiếu hụt nguồn cung điện đáng kể.

Which programming languages are most token-efficient?

Các LLM (Large Language Models) gặp khó khăn với độ dài ngữ cảnh do hạn chế bộ nhớ trong kiến trúc transformer hiện tại.
Ngôn ngữ lập trình có khả năng tiết kiệm token có thể ảnh hưởng đến việc lựa chọn ngôn ngữ trong tương lai, giúp tối ưu dài hạn cho các phiên lập trình.
Dự án RosettaCode có hơn 1.000 tác vụ lập trình thực hiện bằng nhiều ngôn ngữ khác nhau, cung cấp một cơ sở dữ liệu thú vị để so sánh.
APL có độ dài trung bình 110 token, tuy nhiên, không tối ưu cho LLM vì bộ ký tự độc đáo bị chia thành nhiều token.
Ngôn ngữ J, sử dụng ký tự ASCII, chỉ có trung bình 70 token và cho thấy tính hiệu quả cao trong việc tiết kiệm token.
Giữa C (ngôn ngữ kém hiệu quả nhất) và Clojure (ngôn ngữ hiệu quả nhất) tồn tại khoảng cách 2,6 lần về độ tiết kiệm token.
Ngôn ngữ động thường tiết kiệm token hơn các ngôn ngữ tĩnh, nhưng JavaScript là ngôn ngữ động nhiều token nhất.
Một số ngôn ngữ hàm như Haskell và F# có hiệu quả token cao, gần bằng các ngôn ngữ động hiệu quả nhất nhờ hệ thống suy luận kiểu hiệu quả.
Sử dụng Haskell hoặc F# có thể kéo dài thời gian phát triển đáng kể hơn Go hoặc C# với giả định 80% ngữ cảnh là mã nguồn.
Các vấn đề về độ dài mã nguồn có thể ảnh hưởng đến lập trình, ngay cả khi có khả năng tính toán mạnh mẽ.

I ported Photoshop 1.0 to C# in 30 minutes

Claude Code đã thử nghiệm port nguồn gốc của Photoshop 1.0 từ Pascal và 68k Assembly sang C#.
Photoshop 1.0 có khoảng 100k dòng mã Pascal và 20k dòng 68k Assembly.
Việc sử dụng LLM không bị giới hạn bởi ngôn ngữ phổ biến, LLM có thể hiểu các mẫu chung trong phát triển phần mềm.
Claude Code đã thành công trong việc xây dựng ứng dụng chạy được trong C# sau 30 phút, mặc dù vẫn còn vài lỗi và chưa hoàn thiện.
Qua dự án này, có thể thấy LLM có khả năng đơn giản hóa quy trình port ứng dụng giữa các ngôn ngữ lập trình.
Thực tế, việc sử dụng các agent có thể giúp xây dựng ứng dụng MVP/1.0 bằng ngôn ngữ ưa thích rồi port sang ngôn ngữ hiệu suất cao hơn khi cần.
Có khả năng sẽ xuất hiện xu hướng phát triển ứng dụng bản địa cho từng nền tảng thay vì sử dụng các framework cross platform.
Sự kết hợp giữa một ngôn ngữ chủ đạo và việc tự động port mã nhờ các agent có thể tối ưu hóa quy trình phát triển ứng dụng di động.
Triển vọng tương lai của Rust và các ngôn ngữ an toàn bộ nhớ đã được nhấn mạnh do nhiều vấn đề an ninh với C/C++.

Why I’m building my own CLIs for agents

MCP gặp vấn đề với độ dài ngữ cảnh, khiến việc quản lý phiên làm việc tốn kém hơn khi số lượng token tăng lên (từ 10,000 lên 100,000 token).
Việc thêm các công cụ như Playwright có thể tiêu tốn gần 15,000 token, chiếm hơn 10% tổng số token có sẵn trong Claude Code.
Trong các UI “chat” với LLMs, việc tiêu tốn token không lớn như với agents, nơi mà các định nghĩa công cụ có thể gây ra vấn đề.
Ý tưởng về một “tìm kiếm” MCP trung tâm có thể giúp agents tìm kiếm công cụ cụ thể đang được phát triển.
Người dùng có thể tắt các MCP server không cần thiết để tiết kiệm token, nhưng điều này gây khó khăn cho trải nghiệm người dùng.
Việc phát triển và dùng CLI giúp giải quyết vấn đề này, chỉ cần 71 token cho các lệnh cơ bản so với hàng nghìn token của MCP Linear.
Người dùng có thể xây dựng CLIs cho nhiều tác vụ không phải lập trình, tận dụng OpenAPI hoặc API nội bộ từ các trang web.
Người dùng có thể kết nối các công cụ khác nhau, ví dụ từ Gmail đến Ticket trong Linear để tự động hóa quá trình làm việc.

Travel agents took 10 years to collapse. Developers are 3 years in.

Ngành đại lý du lịch ở Mỹ suy giảm mạnh từ 124,000 đại lý vào năm 2000 xuống còn 65,000 vào năm 2012 (giảm 47%) và giảm số lượng cửa hàng từ 34,000 xuống 13,000.
Việc cắt giảm hoa hồng từ các hãng hàng không vào năm 1995 đã dẫn đến tình trạng khó khăn về dòng tiền cho nhiều đại lý du lịch.
Sự phát triển của công nghệ Booking online và OTAs đã gây ra sự hao mòn về lợi nhuận trong ngành du lịch.
Từ năm 2020, việc cắt giảm vốn đầu tư mạo hiểm khoảng 150 tỷ USD đã ảnh hưởng đến thị trường phần mềm, khiến nhiều công ty không cần tuyển dụng thêm lập trình viên.
Đầu vào của LLM trong thị trường phần mềm đã tăng từ 0% vào năm 2022 lên 84% vào năm 2025.
Các công ty quản lý du lịch doanh nghiệp (TMCs) và phân khúc du lịch cao cấp có sự tăng trưởng đáng kể trong thời kỳ này.
Các đại lý du lịch tổng quát bị ảnh hưởng nặng nề, với 59% số cơ sở giảm từ năm 1997 đến 2013, và khoảng 60,000 đại lý đã rời bỏ nghề từ năm 2000 đến 2020.
Sự thiếu hụt chương trình đào tạo lại đã làm cho nhiều đại lý không thể “thăng tiến” trong ngành.
Các nhà phát triển phần mềm cần nhận ra tầm quan trọng của các công cụ tự động hóa, nếu không sẽ phải cạnh tranh trực tiếp với công nghệ.

Are we dismissing AI spend before the 6x lands?

Nghiên cứu của Morgan Stanley chỉ ra rằng tổng cung wafers sẽ tăng từ 117.000 lên 1 triệu trong 4 năm, với NVIDIA chiếm phần lớn (60%).
Broadcom và AMD dự kiến sẽ chiếm 15% và 11% tương ứng trong năm 2026.
Dự đoán lượng exaFLOPs cho năm 2026 từ NVIDIA, AMD, Google TPU và AWS tổng cộng khoảng 122.6 exaFLOPs.
Những công nghệ AI silicon đang tăng trưởng nhanh chóng, đặc biệt từ năm 2024 đến năm 2026 với sự gia tăng 6x khả năng chip AI toàn cầu.
Có sự trì hoãn đáng kể giữa việc hoàn thành chip và thời điểm chip đi vào hoạt động, ước tính ít nhất 1 tháng trong điều kiện lý tưởng.
Sự ra mắt của các bộ tăng tốc AI thế hệ mới gặp khó khăn do yêu cầu làm mát bằng nước.
Ngành công nghiệp trung tâm dữ liệu đang đối mặt với hạn chế về năng lực điện năng, cần lượng lớn điện mới cho sự gia tăng chip Blackwell-class.
Thời gian từ khi chip được cài đặt đến khi hoàn thành đào tạo có thể mất ít nhất 6 tháng.
Không phải tất cả máy tính đều được phân bổ cho đào tạo; ngày càng có nhiều dành cho inference để phục vụ khách hàng hiện tại.
Chi phí đào tạo là một vấn đề lớn, theo Sam Altman, OpenAI sẽ có lãi nếu không vì chi phí này.
Các mô hình AI như Opus 4.5 và Gemini 3 đang thu hút sự chú ý lớn và có tiềm năng cao.

Minification isn’t obfuscation - Claude Code proves it

Một loạt bài viết sẽ được phát hành trong mùa lễ để thảo luận về tác động của agents đối với lĩnh vực phần mềm.
Cần tôn trọng các điều khoản dịch vụ khi kiểm tra phần mềm bên ngoài tổ chức.
Quá trình minification trong JavaScript không bảo mật mã nguồn mà chỉ làm cho nó khó đọc.
Agents đã thay đổi cách tiếp cận trong việc đọc hiểu mã JavaScript minified, loại bỏ rào cản cố hữu trước đây.
Cây cú pháp trừu tượng (AST) được sử dụng để đơn giản hóa việc hiểu và xử lý mã.
Minification loại bỏ tên biến nhưng không làm mất cấu trúc logic của mã.
Sử dụng AST và agents để so sánh hai phiên bản của một gói npm minified cho phép khám phá nhanh chóng nội dung bên trong.
Kết quả từ việc sử dụng 10 subagents cho thấy khả năng phân tích chi tiết trong thời gian ngắn, bao gồm các chi tiết về chức năng chưa phát hành và kiến trúc nội bộ.
Gần như mọi trang web dựa trên React đều có thể bị phân tích ngược tương tự như gói npm.
Người dùng có thể tái tạo mã nguồn của ứng dụng web frontend mà không cần đăng nhập, nếu như trang đăng nhập nằm trong ứng dụng.
Nguy cơ là các bên độc hại có thể khai thác và truy cập mã nguồn nếu không được bảo mật đúng cách.

AI agents are starting to eat SaaS

Trong 15 năm qua, phần mềm đã làm thay đổi nền tảng của nhiều ngành công nghiệp như bán lẻ, truyền thông và tài chính.
Sự gia tăng của các công cụ SaaS dẫn đến sự hình thành rất nhiều công ty SaaS có giá trị tổng cộng lên đến hàng nghìn tỷ USD.
Nhu cầu sử dụng các công cụ SaaS đơn giản đang bắt đầu giảm, nhiều kỹ sư phần mềm đang tìm cách tự phát triển giải pháp.
Các tác vụ phát triển phần mềm không thuần túy đang có xu hướng được giải quyết dễ dàng hơn bằng các AI agents, như Gemini và Claude Code.
Người dùng bắt đầu đặt câu hỏi về việc gia hạn hợp đồng từ các công ty SaaS lớn, khi thấy khả năng tự phát triển giải pháp cho nhu cầu của mình.
Nhiều sản phẩm SaaS có nhiều tính năng không cần thiết cho người dùng, và sự phức tạp trong sản phẩm thường biến mất khi chỉ phục vụ một tổ chức duy nhất.
Vấn đề bảo trì phần mềm vẫn là mối quan tâm lớn; việc quản lý bảo trì khó khăn là điều không thể thay đổi.
Nhiều SaaS hiện tại được bảo trì kém, và việc giữ phần mềm trong mạng riêng sẽ giảm bớt rủi ro bảo mật.
AI agents có khả năng giảm chi phí bảo trì và duy trì kiến thức về mã nguồn.
Việc chuyển đổi API hoặc hủy bỏ các điểm cuối API của SaaS có thể gây ra vấn đề lớn về tài nguyên và thời gian cho các tổ chức.
Các tổ chức có khả năng công nghệ sẽ ngày càng xem xét kỹ lưỡng hơn về khả năng phát triển nội bộ thay vì phụ thuộc vào dịch vụ SaaS.

Has the cost of building software just dropped 90%?

Tác giả đã xây dựng phần mềm chuyên nghiệp gần 20 năm và chứng kiến nhiều thay đổi lớn trong ngành công nghiệp phần mềm, bao gồm sự ra đời của SaaS và xu hướng di động.
Các công cụ coding AI (AI Agents) đang giảm đáng kể chi phí lao động trong phát triển phần mềm, với tiềm năng tiết kiệm lên tới 90%.
Các dự án phát triển phần mềm trước đây mất khoảng một tháng có thể hoàn thành trong một tuần nhờ vào AI Agents.
Việc áp dụng Jevons Paradox cho phát triển phần mềm cho thấy khi chi phí giảm, nhu cầu về phần mềm sẽ tăng lên, với nhiều đơn vị doanh nghiệp sẵn sàng chuyển đổi các quy trình quan trọng từ Excel sang ứng dụng SaaS.
Kiến thức miền (domain knowledge) vẫn quan trọng và có giá trị, bởi con người sẽ đảm nhiệm việc giám sát và tối ưu hóa quy trình làm việc của AI Agents.

daily-digest

Simon Willison’s Weblog

The Pragmatic Engineer

Martin Fowler

Daring Fireball

iDiallo.com

🍵 Maurycy’s Blog

Terence Eden’s Blog

DYNOMIGHT

The Old New Thing

John D. Cook

Andrew Nesbitt

The Silicon Underground

Martin Alderson

Open Source Projects - Latest Discoveries

DEV Community

Hacker News: Best