Simon Willison’s Weblog
Auto mode for Claude Code
- Claude Code giới thiệu chế độ auto mode, cho phép Claude quyết định quyền truy cập thay cho người dùng.
- Auto mode bao gồm các biện pháp bảo vệ kiểm tra hành động trước khi thực hiện (Nguồn: Tài liệu).
- Chế độ này sử dụng Claude Sonnet 4.6 cho việc phân loại và quyết định quyền truy cập.
- Những hành động bị chặn bao gồm việc leo thang quyền truy cập, mục tiêu hạ tầng không đáng tin cậy, và nội dung thù địch.
- Danh sách “allow” chứa các thao tác như xóa file địa phương trong phạm vi dự án và các yêu cầu GET không thay đổi trạng thái.
- Danh sách “soft_deny” bao gồm việc xóa nhánh từ xa và tải và thực thi mã từ nguồn bên ngoài.
- Chế độ auto mode không hoàn toàn bảo vệ chống lại các cuộc tấn công chuỗi cung ứng với các phụ thuộc không được chỉ định.
- Tài liệu lưu ý rằng chế độ này có thể cho phép một số hành động rủi ro nếu ý định người dùng không rõ ràng.
- Có lo ngại về tính đáng tin cậy của các biện pháp bảo vệ dựa trên AI do tính không xác định của chúng.
- Người dùng vẫn muốn một môi trường lập trình an toàn hơn với việc hạn chế quyền truy cập file và kết nối mạng.
- Chế độ auto mode cung cấp tùy chọn lọc mặc định mở rộng nhưng cũng cho phép tùy chỉnh thêm các quy tắc riêng.
Package Managers Need to Cool Down
- Tấn công chuỗi cung ứng LiteLLM khuyến khích nghiên cứu về “dependency cooldowns”.
- “Dependency cooldowns” là phương pháp chỉ cài đặt các phụ thuộc đã được cập nhật sau vài ngày để theo dõi sự an toàn.
- Andrew Nesbitt đã đánh giá cơ chế “dependency cooldown” trong các công cụ đóng gói khác nhau.
- pnpm 10.16 hỗ trợ minimumReleaseAge cho các gói tin cậy (ra mắt tháng 9 năm 2025).
- Yarn 4.10.0 giới thiệu npmMinimalAgeGate với các gói được chấp thuận trước (ra mắt tháng 9 năm 2025).
- Bun 1.3 thiết lập minimumReleaseAge qua bunfig.toml (ra mắt tháng 10 năm 2025).
- Deno 2.6 dùng –minimum-dependency-age cho lệnh cập nhật và kiểm tra trạng thái (ra mắt tháng 12 năm 2025).
- uv 0.9.17 cải tiến hỗ trợ thời gian tương đối và ghi đè trên từng gói (ra mắt tháng 12 năm 2025).
- pip 26.0 cho phép cài đặt dựa trên dấu thời gian tuyệt đối (ra mắt tháng 1 năm 2026).
- npm 11.10.0 giới thiệu min-release-age (ra mắt tháng 2 năm 2026).
- Pip hiện chỉ hỗ trợ ngày tuyệt đối; đã có giải pháp thay thế từ Seth Larson để cập nhật ngày trong pip.conf.
Quoting Christopher Mims
- Christopher Mims, nhà bình luận công nghệ, cho rằng việc “trao quyền kiểm soát hoàn toàn cho AI” sẽ trở nên ngớ ngẩn trong tương lai (The Wall Street Journal, 24/03/2026).
- Simon Willison đã thu thập và đăng câu trích dẫn này vào ngày 24 tháng 3 năm 2026.
- Các bài viết gần đây đề cập đến các chủ đề như Starlette 1.0, người dùng Hacker News và việc OpenAI mua lại Astral.
Malicious litellm_init.pth in litellm 1.82.8 — credential stealer
- Gói LiteLLM v1.82.8 trên PyPI bị xâm nhập với mã độc credential stealer trong file litellm_init.pth.
- Chỉ cần cài đặt gói này là đủ để kích hoạt mã độc, không cần chạy lệnh import litellm (so với phiên bản 1.82.7 phải nhập khẩu để tác động).
- Chương trình độc hại thu thập nhiều loại thông tin bí mật từ nhiều thư mục hệ thống như ~/.ssh/, ~/.aws/, ~/.docker/, ~/.bitcoin/.
- Trivy, công cụ quét bảo mật được LiteLLM sử dụng, có khả năng đã bị khai thác, dẫn đến việc đánh cắp thông tin xác thực PyPI để phát hành các gói dễ bị tổn thương.
- PyPI đã cách ly gói litellm chỉ sau vài giờ kể từ khi phát hiện.
Streaming experts
- Dan Woods thử nghiệm với các mô hình Mixture-of-Experts bằng cách stream weights từ SSD để xử lý từng token.
- Qwen3.5-397B-A17B hoạt động trong 48GB RAM năm ngày trước.
- Kimi K2.5, một mô hình 1 trillion tham số, chạy trong 96GB RAM trên M2 Max MacBook Pro.
- Qwen3.5-397B-A17B chạy trên iPhone với tốc độ 0.6 tokens/giây.
- Daniel Isaac đã làm cho Kimi K2.5 hoạt động trên 128GB M4 Max với tốc độ khoảng 1.7 tokens/giây.
- Các nhà nghiên cứu đang tìm kiếm tối ưu hóa thêm để cải thiện hiệu suất của các mô hình này.
The Pragmatic Engineer
“How to be a 10x engineer” – interview with a standout dev
- Sam là một kỹ sư xuất sắc, nằm trong top 10% kỹ sư của Uber và từng vào “top, top” là 3% kỹ sư tốt nhất (Nguồn: tác giả).
- Sam không tìm kiếm cơ hội nghề nghiệp mà nhận được lời mời phỏng vấn từ các cựu đồng nghiệp.
- Hiện tại, Sam đang có ba cơ hội phỏng vấn nóng, một công ty khởi nghiệp sẵn sàng tạo vị trí mới chỉ để thu hút anh.
- Sam không có sự hiện diện trên mạng xã hội và GitHub của anh gần như trống rỗng trong 5 năm qua.
- Sam không cần công nhận công khai nhưng vẫn duy trì được danh tiếng nghề nghiệp vững vàng.
- Anh nhấn mạnh tầm quan trọng của việc hoàn thành công việc và giao tiếp với các bên liên quan về các quyết định ưu tiên.
- Sam cho biết việc thiết lập ranh giới và nói “không” là điều cần thiết để ưu tiên công việc và gia đình.
- Anh khuyên nên tham gia chính trị văn phòng một cách có chọn lọc, xây dựng mối quan hệ với đồng nghiệp có ảnh hưởng và giao tiếp trực tiếp.
- Trong việc đàm phán và giải quyết xung đột, Sam khuyến nghị tiếp cận các kỹ sư trước khi gặp quản lý của họ.
- Sam đã có cái nhìn cá nhân về quy trình thăng chức tại Big Tech và tầm quan trọng của việc giữ liên lạc và referrals.
- Sam bắt đầu với lập trình từ khi 12 tuổi, phát triển trang web đầu tiên cho trường và công ty của mẹ.
- Anh chuyển từ ngành học không liên quan đến công nghệ sang ngành Khoa học Máy tính trong năm đầu tiên của chương trình thạc sĩ.
Manager.dev
Software engineering calories: what would cal.ai say about your product?
- Tôi làm việc tại nhà suốt năm 2025 và ăn uống khá lành mạnh.
- Sau khi bắt đầu công việc mới vào tháng 10, tôi bắt đầu tăng cân 3 kg trong tháng đầu tiên.
- Tôi cố gắng thiết lập các quy tắc ăn uống nhưng không thành công.
- Một đồng nghiệp đề xuất tôi theo dõi chế độ ăn uống, tôi đã sử dụng cal.ai để ghi lại.
- Tôi nhận ra bữa sáng của mình có hơn 1000 calories do các món như phô mai, salad với mayo và bánh mì.
- Tôi cũng tiêu thụ nhiều đồ ăn vặt mặn hơn mức tưởng tượng.
- Nguyên tắc giảm cân là đốt cháy nhiều calories hơn lượng nạp vào.
- Nhiều công ty cũng không biết chính xác “calories” của sản phẩm mà họ tạo ra.
- Đo số lượng PR là một cách gần gũi để đo lường sản phẩm, nhưng không thể hiện đầy đủ giá trị công việc.
- Weave sử dụng ML để ước lượng giá trị calorie thực của từng nhiệm vụ.
- Công cụ này không nhằm mục đích đánh giá giá trị của từng cá nhân mà để hỗ trợ trong việc quản lý công việc.
- PostHog minh bạch dữ liệu và hiểu rằng không phải mọi công việc của lập trình viên đều thể hiện qua số liệu.
Martin Fowler
Bliki: Architecture Decision Record
- Architecture Decision Record (ADR) là tài liệu ngắn ghi chép một quyết định liên quan đến sản phẩm hoặc hệ sinh thái.
- ADR nên dài chỉ từ vài trang, bao gồm quyết định, bối cảnh và hệ quả quan trọng (nguồn: Michael Nygard).
- Viết ADR giúp làm rõ suy nghĩ và thảo luận các quan điểm khác nhau trong nhóm.
- Theo quy tắc, thu thập ADR trong kho mã nguồn nơi mã liên quan, thường ở thư mục doc/adr.
- Mỗi ADR phải là một tệp riêng, được đánh số tuần tự và đặt tên có mô tả quyết định.
- ADR có các trạng thái: “proposed”, “accepted”, và “superseded”. Một ADR đã được chấp nhận không bao giờ nên được thay đổi.
- ADR không chỉ chứa quyết định mà còn lý do ngắn gọn và các lựa chọn nghiêm túc đã xem xét.
- Cần ghi rõ hệ quả của quyết định và mức độ tự tin khi ra quyết định.
- ADR cũng được sử dụng trong Quy trình Lời khuyên để tài liệu hóa quyết định và thu thập ý kiến.
- Độ ngắn gọn là quan trọng, ADR nên chỉ một trang và liên kết tài liệu hỗ trợ khi cần thiết.
- Khái niệm viết hồ sơ quyết định ngắn có thể áp dụng trong nhiều bối cảnh khác nhau.
Jeff Geerling
Using FireWire on a Raspberry Pi
- Apple đã ngừng hỗ trợ FireWire (IEEE 1394) trong macOS 26 Tahoe.
- Canon GL1 camera của tôi có cổng ‘DV’ để kết nối với máy Mac cũ hoặc máy Mac hiện đại chạy macOS < 26.
- Với sự hỗ trợ của Apple bị ngưng, tôi chuyển sang Linux và dvgrab để lưu trữ video.
- Linux sẽ ngừng hỗ trợ IEEE 1394 vào năm 2029, còn ba năm sử dụng.
- Sử dụng Raspberry Pi với GeeekPi Mini PCIe HAT và StarTech Mini PCIe FireWire adapter để nhận diện bộ điều khiển FireWire.
- Cần phải biên dịch lại kernel Linux để hỗ trợ FireWire và cấu hình PCIe bus cho 32-bit DMA.
- Cấu hình các tùy chọn khởi động trong file /boot/firmware/config.txt và cmdline.txt.
- Sau khi cấu hình, có thể sử dụng thiết bị FireWire qua cổng FireWire 400.
- Để sử dụng cổng FireWire 800, cần cấp nguồn cho đầu nối trên thẻ Mini PCIe.
- dvgrab cho phép ghi lại video từ camera ở chế độ camera hoặc ‘VCR’.
- dvgrab có thể được sử dụng tương tác và có thể tích hợp vào các script.
- Tôi đã chia sẻ video mẫu đầu tiên với thiết lập này trên GitHub.
Daring Fireball
Claude Can Now Take Control of Your Mac
- Claude Cowork và Claude Code cho phép Claude sử dụng máy tính của bạn để hoàn thành nhiệm vụ.
- Claude có thể điều khiển trình duyệt, chuột, bàn phím và màn hình để thực hiện các tác vụ mà không cần thiết lập.
- Tính năng này hiện có sẵn trong phiên bản nghiên cứu cho người dùng Claude Pro và Max.
- Claude bắt đầu bằng cách sử dụng công cụ chính xác nhất, như các connector với Slack hoặc Google Calendar.
- Claude luôn yêu cầu sự cho phép của người dùng trước khi truy cập vào các ứng dụng mới.
- Hệ thống của Claude có các biện pháp bảo vệ để giảm thiểu rủi ro, bao gồm phát hiện hoạt động không mong muốn.
- Dispatch cho phép người dùng giao nhiệm vụ cho Claude từ điện thoại và theo dõi tiến độ qua máy tính.
- Bạn có thể yêu cầu Claude kiểm tra email hoặc lấy số liệu định kỳ tự động.
- Tính năng sử dụng máy tính của Claude chỉ hỗ trợ macOS và cần được kích hoạt trong cài đặt ứng dụng máy tính.
WSJ: ‘OpenAI Plans Launch of Desktop “Superapp”’
- Trang không tìm thấy (404 error).
- Kiểm tra lại URL đã nhập vào trình duyệt.
- Nếu vào trang này từ website hoặc tìm kiếm, thông báo qua email đến support@wsj.com.
OpenAI Is Closing Sora
iOS 26.4
- Phiên bản mới nhất của iOS 26.4 có sẵn để tải xuống.
- Cập nhật không có tính năng Siri mong đợi nhưng có một số bổ sung mới như emoji và tính năng âm nhạc AI.
- Tính năng Playlist Playground trong Apple Music cho phép người dùng tạo danh sách phát từ ý tưởng văn bản, với tối đa 25 bài hát.
- iOS 26.4 thêm tám emoji mới, bao gồm trombone, rương kho báu, mặt biến dạng, sinh vật lông lá, và vũ công ballet.
- Apple Music giới thiệu tính năng “Concerts Near You” giúp tìm kiếm các buổi biểu diễn gần khu vực của người dùng.
- Tính năng nhận diện bài hát trong Control Center nay có thể sử dụng ngoại tuyến và cung cấp kết quả khi có kết nối mạng trở lại.
- Các thành viên trưởng thành trong nhóm Family Sharing giờ đây có thể sử dụng phương thức thanh toán riêng biệt cho các giao dịch.
- Apple Podcasts bổ sung khả năng podcast video với trải nghiệm xem chất lượng cao và hỗ trợ tải xuống để xem ngoại tuyến.
- Chức năng Bảo vệ Thiết bị Bị đánh cắp được kích hoạt mặc định cho tất cả người dùng iPhone với yêu cầu xác thực bổ sung.
- Có các hoạt động mới trong ứng dụng Messages, như hiệu ứng khi bắt đầu cuộc trò chuyện mới.
- Thiết kế tài khoản Apple thống nhất mới hiện hữu trong App Store và các ứng dụng khác, thay thế chức năng trước đó của trang hồ sơ.
- Widget Âm nhạc Môi trường mới hỗ trợ phát nhạc cho giấc ngủ, năng suất và sức khỏe trên màn hình chính và màn hình khóa.
Following Google’s Lead With Pixel Phones, Samsung Announces AirDrop Support With Galaxy S26 Phones
★ What to Do About Those Menu Item Icons in MacOS 26 Tahoe
- Lệnh “defaults write -g NSMenuEnableActionImages -bool NO” ẩn các biểu tượng trong menu trên macOS Tahoe.
- Cài đặt này không cần khởi động lại hoặc đăng xuất, nhưng cần đóng và khởi động lại các ứng dụng đang chạy.
- Một số ứng dụng của Apple tuân theo cài đặt này hoàn toàn, trong khi một số khác chỉ một phần hoặc không tuân thủ.
- Finder, Notes, Photos, Preview và TextEdit hầu như không hiển thị biểu tượng trong menu.
- Ứng dụng Mail và Calendar có sự không đồng nhất trong việc ẩn biểu tượng menu.
- Safari vẫn hiển thị nhiều biểu tượng menu mặc dù đã áp dụng cài đặt ẩn, chỉ 3 trong số 18 mục menu không có biểu tượng trong menu File.
- Ứng dụng không dùng AppKit như Messages, Maps và Journal hầu hết không tuân thủ việc ẩn biểu tượng.
- Cần cải thiện để tất cả ứng dụng hỗ trợ cài đặt global này và đưa nó vào System Settings app.
- Gợi ý cho các ứng dụng bên thứ ba là loại bỏ biểu tượng menu để giảm sự lộn xộn thị giác.
- Biểu tượng chỉ nên xuất hiện bên cạnh các mục menu làm tăng độ rõ ràng.
- Cần có quy tắc rằng biểu tượng chỉ xuất hiện nếu có thể thay thế tên lệnh.
- Cần thêm chỉ các biểu tượng có thể cung cấp giá trị rõ ràng, để hạn chế sự lộn xộn thị giác.
Pebble Time 2 Is In Mass Production!
- Pebble Time 2 đã bước vào giai đoạn sản xuất hàng loạt sau khi hoàn tất kiểm tra và thay đổi thiết kế.
- Dự kiến sản xuất 500 đồng hồ mỗi ngày sau một tháng, với số lượng đơn đặt hàng vượt quá 20,000.
- Những chiếc đồng hồ đầu tiên sẽ được giao trong tuần cuối của tháng Ba, hoàn tất giao hàng vào đầu tháng Sáu.
- Mỗi đồng hồ được thử nghiệm với độ sâu nước 30M (3 ATM) nhưng không phải là đồng hồ lặn; không nên ngâm lâu hay sử dụng trong môi trường nước nóng.
- Pebble Time 2 sở hữu màn hình lớn, tuổi thọ pin lâu; hỗ trợ hơn 10,000 ứng dụng và giao diện đồng hồ hiện có.
- Tích hợp 2 micro và loa chống nước; không hỗ trợ gọi điện.
- Tuổi thọ pin trung bình khoảng 2 tuần; cần tiếp tục cập nhật phần mềm để đạt 4 tuần.
- Thiết kế từ thép không gỉ, kính Gorilla Glass; có thể bị xước nếu va đập mạnh.
- Đã trang bị cảm biến SPO2 nhưng chưa được sử dụng trong thuật toán phân tích sức khỏe.
iDiallo.com
The nth War of the Decade
- AI ảnh hưởng tới quy trình tuyển dụng và mã code trong ngành công nghệ (giả thuyết).
- Chiến tranh hiện tại của Mỹ có thể so sánh với các tiêu chuẩn HTML: chỉ là gợi ý có thể được áp dụng hoặc không.
- Mọi người đều có quyền nói về chiến tranh, không chỉ các chuyên gia (quyền bình luận).
- Ký ức đầu đời về tin tức là hình ảnh trẻ em Palestine ném đá vào xe tăng của quân đội Israel.
- Bị gắn với mặt nạ phòng độc từ chính phủ Saudi trong thời gian Chiến tranh Vùng Vịnh.
- Chiến tranh Kosovo và Chechnya tạo nên bối cảnh xung quanh cuộc sống của tác giả nhưng không được hiểu rõ.
- Chiến tranh Iraq khiến ít nhất một triệu người thiệt mạng (thống kê).
- Câu hỏi về tính hợp pháp của cuộc chiến tranh: Iraq có phải là cuộc chiến tranh hợp pháp hay không?
- Khó khăn trong việc phân biệt giữa thông tin đúng và thông tin sai lệch trong bối cảnh truyền thông và video hiện đại.
- Vai trò của Liên Hợp Quốc và Tòa án Quốc tế trong việc xử lý trách nhiệm chiến tranh không rõ ràng.
- Khó khăn trong việc chấp nhận sự tàn sát phụ nữ và trẻ em trong bối cảnh chiến tranh.
- Cuộc chiến tranh luôn chứa đựng sự hỗn loạn, với các quy tắc trở nên mờ nhạt theo từng cuộc xung đột.
Pluralistic: Daily links from Cory Doctorow
Pluralistic: Goodhart’s Law vs “prediction markets” (24 Mar 2026)
- Goodhart’s Law nói rằng “khi một thước đo trở thành mục tiêu, nó không còn là thước đo tốt.”
- Pagerank là hệ thống của Google để xác định độ uy tín của trang web qua các liên kết, nhưng đã bị lạm dụng do việc tối ưu hóa để kiếm liên kết.
- “Wisdom of crowds” khẳng định rằng ý kiến trung bình của nhiều người thường chính xác hơn so với ý kiến của chuyên gia.
- Một nghiên cứu vào năm 1906 cho thấy 800 người ước lượng khối lượng của một con bò, và trung bình họ gần đúng với thực tế (1207 lbs so với 1198 lbs thật).
- Khái niệm “giá trong tương lai” trong kinh tế học phản ánh sự tin tưởng của thị trường vào các sự kiện sắp xảy ra, như giá dầu hiện tại dự đoán vận hành tương lai của sản xuất.
- Hệ thống “wisdom of crowds” đã tạo ra nhiều dự án Internet, từ Yahoo Answers đến Wikipedia, với kết quả khác nhau.
- Lợi ích và tác hại của “incentives” trong kinh tế có thể thấy rõ qua cách mà người giàu và quyền lực thường không bị quản lý giống như người lao động.
Terence Eden’s Blog
Book Review: If We Cannot Go at the Speed of Light by Kim Choyeop ★★☆☆☆
- Short stories allow brief immersion with little development, focusing on exposition over action.
- The collection contains extensive infodumping, detracting from plot progression.
- Many stories begin with interesting premises but fail to deliver satisfactory conclusions.
- “The Materiality of Emotions” features a concept of trinkets inducing emotions but ends abruptly.
- “Spectrum” showcases engaging world-building but is derivative and familiar in storyline.
- Overall, the collection is disappointing and lacks originality.
The Old New Thing
Windows 95 defenses against installers that overwrite a file with an older version
- Trong thời kỳ Windows 16-bit, các thành phần hệ thống có thể được phân phối lại và cài đặt cùng với chương trình.
- Hướng dẫn yêu cầu cài đặt so sánh số phiên bản của tệp hiện có với tệp sẽ cài đặt và chỉ ghi đè nếu tệp mới có số phiên bản cao hơn.
- Những trình cài đặt đôi khi không tuân theo hướng dẫn này, gây ra sự cố khi thay thế các tệp Windows 95 bằng các tệp Windows 3.1.
- Windows 95 lưu một bản sao dự phòng của các tệp thường bị ghi đè trong thư mục ẩn C:\Windows\SYSBCKUP.
- Sau khi cài đặt hoàn tất, Windows 95 kiểm tra và khôi phục lại các tệp bị ghi đè nếu cần.
- Thiết kế trước đó ngăn chặn việc ghi đè, nhưng điều này dẫn đến nhiều vấn đề hơn cho người dùng và trình cài đặt.
- Một số trình cài đặt cố gắng khởi động lại hệ thống để ghi đè tệp khi bị ngăn cản.
- Một số thành phần đã phát triển trình cài đặt riêng và yêu cầu các trình cài đặt khác không được cài đặt tệp trực tiếp.
John D. Cook
From Mendeleev to Fourier
-
| Bất đẳng thức của Markov: Nếu P(x) là một đa thức thực độ n, và |
P(x) |
≤ 1 trên [-1, 1], thì |
P′(x) |
≤ n² trên [-1, 1]. |
-
| Bất đẳng thức của Bernstein: Nếu P(x) là một đa thức lượng giác độ n, và |
P(z) |
≤ 1 trên [-π, π], thì |
P′(x) |
≤ n trên [-π, π]. |
- Đa thức lượng giác là một chuỗi Fourier bị cắt ngắn.
- Giá trị lớn nhất của T′ không vượt quá n lần giá trị lớn nhất của T.
- Bài viết này và bài trước được thúc đẩy bởi bài viết mới nhất của Terence Tao về lý thuyết Bernstein.
Mendeleev’s inequality
- Dmitri Mendeleev nổi tiếng với việc tạo ra bảng tuần hoàn các nguyên tố hóa học.
- Mendeleev nghiên cứu về trọng lực riêng của dung dịch theo phần trăm chất tan.
- Ông sử dụng các đa thức bậc hai (quadratic polynomials) để phù hợp với dữ liệu, cụ thể là splines bậc hai.
-
| Định lý của Mendeleev chỉ ra rằng nếu P(x) là đa thức bậc hai trên [-1, 1] có |
P(x) |
≤ 1, thì |
P′(x) |
≤ 4. |
-
| Andrey Markov tổng quát định lý của Mendeleev cho đa thức bậc n: |
P′(x) |
≤ n² nếu |
P(x) |
≤ 1 trên [-1, 1]. |
- Cả hai bất đẳng thức đều là sắc nét (sharp); xảy ra khi P(x) = ±Tn(x), với Tn(x) là đa thức Chebyshev bậc n.
- Trong trường hợp đặc biệt của định lý Mendeleev, trọng số bằng 2 xảy ra cho T2(x) = 2x² − 1.
- Vladimir Markov đã chứng minh một mở rộng của định lý Andrey cho các đạo hàm bậc cao hơn.
🍵 Giles’ blog
Writing an LLM from scratch, part 32g – Interventions: weight tying
- Trong cuốn sách “Build a Large Language Model (from Scratch)” của Sebastian Raschka, weight tying giảm số lượng tham số nhưng có thể gây hại cho hiệu suất của mô hình (Raschka).
- Mô hình 163M tham số của tác giả được thử nghiệm để xem weight tying có ảnh hưởng tiêu cực hay không.
- Mặc dù weight tying ít được sử dụng trong các mô hình LLM hiện đại, tác giả nhận thấy bias QKV có lợi cho mô hình của mình.
- Weight tying cho phép tái sử dụng các tham số nhúng cho ma trận dự đoán đầu ra, giúp tiết kiệm tham số và tăng tốc độ huấn luyện.
- Kỹ thuật weight tying yêu cầu rằng không gian nhúng khi vào và ra phải giống nhau, điều này có thể hạn chế khả năng của LLM.
Westenberg.
Tread carefully, because you tread on my fucks.
- Mỗi ngày, tác giả có khoảng 5 “fucks” để cho đi, tức là một lượng chú ý và tình cảm có hạn (nỗi lo lắng cá nhân, công việc, gia đình).
- Tác giả không thể mở rộng khả năng chú ý của mình vì áp lực xã hội hay sự chỉ trích từ người khác.
- Herbert Simon đã mô tả vào năm 1971 rằng “sự phong phú thông tin” tạo ra “sự nghèo nàn về chú ý” (nếu không có sự gia tăng chú ý, thông tin chỉ gây ra áp lực).
- Adam Smith trong “The Theory of Moral Sentiments” chỉ rõ rằng sự đồng cảm có giới hạn, giảm dần theo khoảng cách (địa lý, mối quan hệ).
- Nghiên cứu của Robin Dunbar chỉ ra giới hạn về khả năng duy trì mối quan hệ có ý nghĩa là khoảng 150 người.
- Sự tiếp xúc với nhiều nỗi đau từ internet có thể dẫn đến tình trạng mệt mỏi về đồng cảm.
- Tác giả đề cập rằng giới hạn chú ý của bản thân không phải là một thất bại đạo đức mà là một ngân sách sinh học không thể thương lượng.
Susam Pal
Wander 0.2.0
- Wander 0.2.0 là phiên bản thứ hai của Wander, một web console phi tập trung, tự lưu trữ (24 tháng 3 năm 2026).
- Phiên bản này cải tiến trải nghiệm người dùng với sandbox iframe, ngăn chặn các tác động không mong muốn từ console cha (sandboxing).
- Hơn 30 người đã thiết lập console Wander trên website cá nhân của họ chỉ trong vòng một tuần sau thông báo trên Hacker News.
- Mạng lưới console hiện tại có hơn 100 trang web được đề xuất.
- Chủ sở hữu console có thể tùy chỉnh với CSS hoặc JavaScript tùy chọn và chặn một số URL không được khuyến nghị.
- Tính năng Console dialog box mở rộng hiển thị chi tiết cấu hình console và lịch sử lướt web.
- Dialog box bao gồm thông tin về các trang web đã được đề xuất và console đã khám phá.
Entropic Thoughts
Lines of code are useful
- Dòng mã (lines of code) được xác nhận là chỉ số đo độ phức tạp của mã nguồn.
- Basili và Hutchens (1981) cho thấy dòng mã tương quan mạnh với định nghĩa khối lượng và độ phức tạp cyclomatic (+0.88) (Basili & Hutchens, 1981).
- Revilla và van der Meulen (2007) phân tích hơn 70,000 chương trình C cho thấy dòng mã có mối tương quan rất cao với Halstead volume (+0.82) và độ phức tạp cyclomatic (+0.78) (Revilla & van der Meulen, 2007).
- Herraiz và Hassan (2010) tìm thấy rằng dòng mã tương quan mạnh với độ phức tạp cyclomatic (+0.72) và nhiều chỉ số Halstead khác (+0.91) (Herraiz & Hassan, 2010).
- Không có chỉ số đo độ phức tạp nào tốt hơn dòng mã trong các nghiên cứu đã được thực hiện.
- Dòng mã là phương pháp tốt nhất hiện tại để đo độ phức tạp của mã nguồn.
- Độ phức tạp quyết định chi phí xây dựng và bảo trì phần mềm.
- Phân biệt giữa độ phức tạp thiết yếu (essential complexity) và độ phức tạp ngẫu nhiên (accidental complexity) là cần thiết.
- Độ phức tạp thiết yếu xuất hiện do vấn đề cần giải quyết.
- Độ phức tạp ngẫu nhiên là sự phức tạp không cần thiết trong mã do quá trình chuyển đổi vấn đề thành phần mềm.
- Sự phát triển của công cụ lập trình giúp giảm bớt độ phức tạp ngẫu nhiên.
Computer Things
Choose Boring Technology and Innovative Practices
- Sử dụng công nghệ mới có nhiều “unknown unknowns” trong khi công nghệ cũ đã biết rõ nguy cơ.
- Công nghệ mới mang lại gánh nặng bảo trì lâu dài mà công nghệ cũ không có.
- Chi phí chính của công nghệ là bảo trì, không chỉ là việc xây dựng.
- Việc chuyển đổi từ công nghệ như Julia sang Postgres hoặc Java tốn kém và cần nguồn lực duy trì kỹ năng.
- Công nghệ thay đổi chậm nhưng dễ dàng hơn cách thức thay đổi quy trình.
- Bỏ qua quy trình như TCR không tốn kém như bỏ qua công nghệ di sản.
- Công ty nên cẩn trọng với phần mềm nhưng có thể đổi mới trong quy trình dễ hơn.
- Công nghệ chia thành “material” (cần thiết cho hoạt động kinh doanh) và “tools” (không phụ thuộc vào vật liệu).
- Công cụ dễ thay thế hơn vật liệu, vì vậy có thể đổi mới hơn trong công cụ.
Ed Zitron’s Where’s Your Ed At
The AI Industry Is Lying To You
- Công suất bổ sung của trung tâm dữ liệu Mỹ giảm một nửa từ quý 3 đến quý 4 năm 2025 do các vấn đề liên quan đến hàng đợi tải (Wood Mackenzie).
- Texas vẫn dẫn đầu về khả năng mở rộng, trong khi New Mexico, Indiana và Wyoming có mức tăng trưởng tương đối cao hơn.
- 33% công suất trung tâm dữ liệu đã công bố ở Mỹ thực sự đang trong quá trình xây dựng; phần còn lại chủ yếu là dự án tiềm năng và giấy phép chưa được phê duyệt.
- 58% công suất tiêu thụ điện đã cam kết cho các “utility wires-only”, tức là nhà cung cấp chỉ chịu trách nhiệm cung cấp điện nhưng không tạo ra điện, gây khó khăn trong phát triển các trung tâm dữ liệu.
- PJM, một trong những nhà cung cấp dịch vụ tiện ích lớn nhất ở Mỹ, đã cam kết cấp điện cho trung tâm dữ liệu với tỷ lệ gấp ba lần so với công suất phát điện mới.
- Tổng vốn đầu tư cho trung tâm dữ liệu ở Mỹ lên tới khoảng 948 tỷ USD, nhưng tốc độ tăng trưởng vốn đầu tư đã chậm lại lần đầu tiên kể từ năm 2023.
- NVIDIA dự kiến sẽ bán 1 ngàn tỷ USD GPU từ năm 2025 đến 2027, nhưng chỉ một phần nhỏ công suất yêu cầu sẽ được đáp ứng vì vấn đề nguồn cung điện.
Jim Nielsen’s Blog
Code as a Tool of Process
- Lập trình là hoạt động cải thiện qua từng bước, giống như viết văn.
- Quá trình xây dựng từng phần giúp nhận ra các câu hỏi chi tiết về cách hoạt động của nó.
- Sử dụng AI để tạo mã có thể bỏ lỡ sự hiểu biết về từng phần nhỏ, dẫn đến hiểu nhầm tổng thể.
- Việc viết mã giúp làm rõ tư duy và xác định tính đúng đắn của chương trình.
- Khi ngừng viết mã và chỉ tạo mã, bạn mất đi quy trình giúp cải thiện tư duy.
- Tạo mã nhanh hơn nhưng cũng khiến bạn không nhìn thấy những gì bạn đang bỏ lỡ.
- Cần nhận thức về các sự đánh đổi khi lựa chọn công cụ và quy trình làm việc, như việc sử dụng búa và xẻng so với thuốc nổ để tìm vàng.
The Silicon Underground
eMachines never obsolete PCs: More than a meme
- eMachines quảng bá chiến dịch “Never Obsolete” bắt đầu vào năm 1999, với giá máy tính khởi điểm là 399 USD (nguồn: lịch sử eMachines).
- Công ty phát hành cổ phiếu lần đầu vào ngày 23 tháng 3 năm 2000, sau khi bán được 2 triệu máy tính trong năm 1999.
- eMachines dùng CPU 366 MHz hoặc 566 MHz và 32 MB RAM cho các mẫu máy tính, vốn đã sắp lỗi thời ngay khi bán (nguồn: phân tích sản phẩm).
- Chiến lược giá của eMachines rất cạnh tranh, khi máy tính của họ rẻ hơn rất nhiều so với mức giá khoảng 699 USD của đối thủ lớn (HP, Dell, Apple).
- Thời điểm đó, eMachines trở thành một trong những thương hiệu máy tính gây rối nhất trong những năm 90.
- Sticker “Never Obsolete” trên máy tính có ngụ ý rằng khách hàng có thể nâng cấp máy tính sau 2 năm với giá 99 USD, nhưng điều này có nhiều điều khoản hạn chế.
- Khách hàng phải mua dịch vụ Internet từ eMachines với giá 19,99 USD/tháng trong 24 tháng để đủ điều kiện nâng cấp.
- Người dùng chỉ có 90 ngày để trả lại máy tính với nguyên bao bì và chứng từ gốc để nhận máy tính đã nâng cấp (nguồn: điều khoản dịch vụ).
- Mức độ nâng cấp phụ thuộc vào giá gốc của máy tính và không phải luôn là một bộ máy hoàn toàn mới (chỉ thay CPU hoặc nhiều linh kiện hơn).
- Giá nâng cấp 99 USD có thể không phải là một món hời nếu chỉ nhận chip CPU thay thế (nguồn: phân tích đề nghị nâng cấp).
- Dịch vụ Internet là một nguồn thu nhập cho eMachines, giúp công ty ước lượng số lượng khách hàng tiềm năng sẽ đăng ký nâng cấp.
- Triển khai kế hoạch “Never Obsolete” tương tự như cách mà các cửa hàng máy tính độc lập đã làm trong quá khứ.
matduggan.com
Hosting a Snowflake Proxy
- Snowflake là một hệ thống vượt qua kiểm duyệt, cho phép giao tiếp mạng bất chấp sự can thiệp của kiểm duyệt viên (từ David Fifield).
- Snowflake sử dụng mạng lưới các proxy tạm thời, gọi là snowflakes, giao tiếp qua giao thức WebRTC.
- Mạng proxy lớn của Snowflake có khoảng 100.000 proxy tạm thời, không phải lúc nào cũng là những proxy giống nhau.
- Để chống lại việc chặn theo địa chỉ, Snowflake tạo ra một lượng lớn proxy dễ triển khai.
- Để chống lại việc chặn theo nội dung, Snowflake mã hóa lưu lượng truy cập trong một container WebRTC.
- Snowflake đã hoạt động trong hơn ba năm và là một tùy chọn vượt qua kiểm duyệt có sẵn trong Tor Browser.
- Trung bình, Snowflake phục vụ vài chục ngàn người dùng tại bất kỳ thời điểm nào.
- Cài đặt Snowflake trên hệ điều hành Debian chỉ mất khoảng 5 phút với lệnh cài đặt đơn giản.
Troy Hunt
Weekly Update 496
- OpenClaw is an early-stage AI technology with potential for significant impact.
- Current functionality may seem rudimentary, akin to a rickety plane.
- Many claims about OpenClaw’s capabilities are exaggerated.
- Evaluating new technology requires discerning actual value amid hype.
- The writer has discovered useful applications of OpenClaw for work purposes.
- A future video will focus on these applications and their benefits.
Open Source Projects - Latest Discoveries
Automate your entire coding workflow with a team of AI agents
Code with Claude Code and Gemini offline on your mobile device
Turn your terminal into a complete development and deployment environment
Build Claude AI agents that execute code and complete tasks
Generate efficient C code from Go using this command line transpiler
Master Seedance API workflows with this open-source prompt engineering guide
Build and manage AI agents directly from your terminal interface
The definitive open-source tool for building fast and portable automations
The definitive Mesa driver for Android container graphics with Freedreno
A self-hosted knowledge base for every conversation with ChatGPT and Claude
Manage your entire iOS sideloading workflow with this Rust-based application
Build and run R code faster with this terminal written in Rust
PubMed Has a Free API — Search 35M+ Medical Papers Without Scraping (No Key)
Semantic Scholar Has a Free API — Search 200M+ Papers With AI-Powered Relevance (No Key)
Compliance Communication Email Templates: Make Regulatory Requirements Human-Readable
Your Pipeline Is 24.7h Behind: Catching Entertainment Sentiment Leads with Pulsebit
AI Agent Security: The Threat Model Nobody Talks About
The Litellm Supply Chain Attack: What Developers Need to Know About Package Security
Ethics Reporting Email Guide: How to Raise Ethical Concerns at Work
When to Use Multi-Agent Systems (And When Not To)
Workplace Investigation Response Emails: What to Write When HR Comes Knocking
How to Give Your AI Agent a Memory That Actually Works
A developer’s guide to JSON — formatting, validation, and common mistakes
Your Pet’s Next Doctor Visit Might Be an App — How 8 Countries Are Proving It
Hacker News: Best
🔥 Is anybody else bored of talking about AI?
🔥 GitHub is once again down
🔥 Goodbye to Sora
🔥 Wine 11 rewrites how Linux runs Windows games at kernel with massive speed gains
🔥 Arm AGI CPU
🔥 Apple Business
🔥 Mystery jump in oil trading ahead of Trump post draws scrutiny
🔥 LaGuardia pilots raised safety alarms months before deadly runway crash
🔥 The bridge to wealth is being pulled up with AI
🔥 So where are all the AI apps?