Simon Willison’s Weblog
Quoting Jeremy Daer
- Sử dụng CLI tools thay cho REST APIs nhằm tiết kiệm context window và cải thiện độ chính xác khi có nhiều cuộc gọi tool liên quan.
- Việc gọi đúng thứ tự là quan trọng, đặc biệt cho các tình huống như phân trang, xử lý backoff do giới hạn tốc độ, và nhận diện lỗi xác thực.
- CLI giúp các mô hình rẻ và nhanh như gpt-5-nano hay haiku-4.5 có thể thành công đáng tin cậy.
- Raw API chỉ phục vụ mô hình mạnh như gpt-5.2 hay opus-4.5, tiêu tốn nhiều tài nguyên và tokens do yêu cầu nhiều vòng lặp tư duy.
- Những yêu cầu API một lần hoặc sử dụng theo cách ngẫu nhiên có thể hiệu quả cho nhà phát triển, nhưng là thảm họa cho các agent tự động thực hiện công việc lặp đi lặp lại.
Open Source Projects - Latest Discoveries
The open-source tool to scrape any website with AI intelligence
- CyberScraper 2077 là công cụ scraping mã nguồn mở, sử dụng AI để xử lý dữ liệu từ các website hiện đại.
- Công cụ này dựa trên Python và sử dụng headless browser (Playwright) để điều hướng và thực thi JavaScript.
- AI giúp phân tích cấu trúc và nội dung trang, cho phép khai thác dữ liệu ngay cả khi HTML phức tạp hoặc thay đổi.
- Phương pháp khai thác dựa trên mục tiêu thay vì CSS selector, giảm thiểu sự phụ thuộc vào cấu trúc HTML cụ thể.
- CyberScraper 2077 có khả năng xử lý các ứng dụng đơn trang (SPAs) và chờ nội dung động xuất hiện.
- Dễ dàng mở rộng, cho phép tích hợp các mô hình AI khác nhau và tùy chỉnh logic khai thác cho từng trang web.
- Dự án có sẵn trên GitHub, yêu cầu Python và pip để cài đặt và cấu hình.
- Để sử dụng tính năng AI, cần thiết lập API key từ OpenAI dưới dạng biến môi trường.
The open-source downloader that prepares videos for your home media server
- Hometube là công cụ tải video mã nguồn mở, tự lưu trữ cho máy chủ media cá nhân.
- Ứng dụng cho phép tải video từ các trang web hỗ trợ trực tiếp về máy chủ của bạn.
- Người dùng chỉ cần dán URL vào giao diện và Hometube sẽ tải video và tổ chức nó theo tiêu đề thích hợp.
- Hometube tích hợp tốt với Plex, Jellyfin và Emby để lưu trữ file cục bộ.
- Hometube không có giới hạn sử dụng, không có dịch vụ trung gian, và không dữ liệu rời khỏi mạng của bạn.
- Ứng dụng được viết bằng Go, dễ dàng triển khai trên nhiều thiết bị như Raspberry Pi và máy chủ tại nhà.
- Dễ dàng bắt đầu với hướng dẫn có trong README trên GitHub.
Reverse engineer any WhatsApp number for privacy and device analysis
- Dự án WhatsApp-OSINT cung cấp công cụ tự động thu thập thông tin từ số điện thoại trên WhatsApp.
- Công cụ này kiểm tra xem số điện thoại có đăng ký trên WhatsApp hay không, lấy ảnh đại diện và trạng thái “about” của người dùng (nếu công khai).
- Dự án sử dụng Python và selenium để mô phỏng tương tác với giao diện web của WhatsApp, giúp tăng độ ổn định so với việc sử dụng API không chính thức.
- Người dùng cần cài đặt Python, các thư viện cần thiết, và trình duyệt Chrome với phiên bản chromedriver tương ứng để chạy công cụ.
- Dựa trên địa chỉ GitHub, người dùng có thể clone repo và thực hiện các lệnh để cài đặt và chạy script.
- Người dùng nên sử dụng công cụ này một cách có trách nhiệm và chỉ kiểm tra các số điện thoại mà họ sở hữu hoặc có sự đồng ý.
- Công cụ này là ví dụ điển hình về phân tích quyền riêng tư và tự động hóa trình duyệt, phù hợp cho việc học web scraping với Selenium.
Unlimited cloud storage using your existing Telegram account as backend
- Pentaract là công cụ mã nguồn mở sử dụng tài khoản Telegram để lưu trữ file cá nhân (nguồn: mô tả dự án).
- Nó sao lưu và đồng bộ hóa nội dung từ thư mục của người dùng lên đám mây Telegram qua các tin nhắn.
- Dữ liệu được mã hóa cục bộ trước khi rời khỏi máy tính, đảm bảo an toàn (End-to-End Encryption).
- Pentaract chia nhỏ các file lớn để phù hợp với giới hạn kích thước của Telegram và sau đó tái cấu trúc lại khi tải xuống.
- Người dùng không cần tài khoản mới; nó sử dụng API có sẵn của Telegram.
- Dự án là một giải pháp lý tưởng cho lưu trữ, sao lưu hoặc đồng bộ file không nhạy cảm mà không cần trả phí.
- Hướng dẫn cài đặt có sẵn trên GitHub, người dùng phải tạo ứng dụng Telegram để lấy api_id và api_hash (nguồn: GitHub).
Turn your research questions into structured AI experiments and analysis
- Dự án AI-PhD-S26 cung cấp khung làm việc có cấu trúc cho các thí nghiệm AI, nhằm tổ chức và làm cho các thí nghiệm có thể tái lập.
- Nó giúp tách biệt các thành phần thí nghiệm như prompts, model calls và logic đánh giá.
- Repository đề xuất một cấu trúc thư mục rõ ràng và quy trình làm việc bắt đầu bằng cách xác định câu hỏi nghiên cứu.
- Dự án giúp ngăn chặn tình trạng “spaghetti experiment” cho các nhà phát triển độc lập hoặc nhóm nhỏ.
- Nó cho phép thử nghiệm A/B các phiên bản prompt với nhiều model mà không cần viết lại logic chính.
- AI-PhD-S26 rất hữu ích cho việc cải thiện prompt, so sánh hiệu suất giữa các LLM, và xây dựng pipeline tái lập cho dữ liệu tổng hợp.
- Người dùng có thể bắt đầu bằng cách sử dụng repository như một mẫu và tùy chỉnh theo ngăn xếp riêng của họ.
Turn your Linux terminal into an AI-powered command line assistant
- cnmsb là một công cụ giao diện dòng lệnh sử dụng OpenAI’s API để tạo các câu lệnh Linux từ mô tả bằng ngôn ngữ tự nhiên.
- Người dùng chỉ cần nhập mô tả công việc, ví dụ “tìm tất cả các file python được chỉnh sửa trong 7 ngày qua” để nhận lệnh tương ứng.
- Công cụ cung cấp giải thích rõ ràng về lệnh đề xuất và cho phép xác nhận, chỉnh sửa hoặc hủy trước khi thực hiện.
- cnmsb là một script Python đơn giản, không thay đổi môi trường làm việc trong terminal của người dùng.
- Nó dễ cấu hình và cho phép thiết lập API key của OpenAI làm biến môi trường.
- Quá trình cài đặt gồm cloning repo, thiết lập API key và chạy script.
- cnmsb không thay thế kiến thức về dòng lệnh mà mở rộng khả năng của người dùng, phù hợp cho cả nhà phát triển mới và những người muốn khám phá các thao tác shell phức tạp.
Learn how to design large-scale systems.
- System Design Primer là một kho tài liệu trên GitHub để thiết kế hệ thống lớn, có khả năng mở rộng và bảo trì tốt.
- Nó bao gồm các khái niệm cơ bản như so sánh SQL và NoSQL, và hướng dẫn thiết kế các hệ thống cụ thể.
- Repo cung cấp cấu trúc giúp bạn chuyển từ việc lập trình một tính năng sang kiến trúc một hệ thống phục vụ hàng triệu người dùng.
- Phương pháp từng bước rất hữu ích cho phỏng vấn thiết kế hệ thống, bao gồm hiểu vấn đề, xác định ràng buộc và phác thảo thiết kế.
- Nó bao gồm các tình huống thực tế để giúp bạn ứng phó với các tình huống bất ngờ như sự cố cache hay đột biến lưu lượng truy cập.
- Phụ lục chứa nhiều chủ đề quan trọng, như consistent hashing và CAP theorem, giúp bổ sung kiến thức cần thiết.
- Tài liệu được cập nhật liên tục bởi các đóng góp viên đang làm việc trong lĩnh vực này.
- Tài nguyên này không cần cài đặt mà bạn chỉ cần khám phá qua trang GitHub: github.com/donnemartin/system-design-primer.
- Bạn nên bắt đầu với Mục Lục và sử dụng phần “Cách tiếp cận câu hỏi phỏng vấn thiết kế hệ thống”.
- Lựa chọn một bài toán thiết kế hệ thống cụ thể để thực hành và tham khảo phụ lục khi cần hiểu sâu hơn về thuật ngữ.
A minimalist Rust CLI to manage your entire terminal file workflow
- Yazi là một terminal file manager được viết bằng Rust.
- Yazi cung cấp TUI (Terminal User Interface) cho phép điều hướng thư mục và xem trước tệp mà không cần rời khỏi terminal.
- Giao diện của Yazi sạch sẽ, tập trung vào tốc độ và hiệu suất.
- Yazi hỗ trợ các thao tác I/O không đồng bộ, cho phép thực hiện các lệnh trong khi các tác vụ lớn đang chạy ở nền.
- Yazi cung cấp khả năng tùy chỉnh cao cho keybindings và chủ đề người dùng.
- Để cài đặt Yazi, cần có Rust toolchain và có thể cài đặt qua Cargo bằng lệnh
cargo install yazi-fm.
- Người dùng có thể khởi động Yazi bằng cách gõ
yazi trong terminal.
The open-source visual editor for React components and pages
- Puck là một trình chỉnh sửa trực quan mã nguồn mở dành cho các thành phần và trang React.
- Nó cho phép nhóm nội dung chỉnh sửa các thành phần React trực tiếp trên trang mà không cần gọi nhà phát triển.
- Người dùng định nghĩa “schema” để Puck biết các thành phần nào có thể chỉnh sửa và thuộc tính nào có thể thay đổi như tiêu đề, mô tả.
- Puck tạo ra bản xem trước trực tiếp của trang, cho phép người dùng chỉnh sửa, kéo thả để sắp xếp hoặc thêm thành phần mới.
- Kết quả đầu ra là dữ liệu JSON sạch sẽ, có thể lưu vào cơ sở dữ liệu và sử dụng để hiển thị trên trang web.
- Puck hoạt động với các thư viện thành phần hiện tại và không khóa vào nền tảng cụ thể nào.
- Việc cài đặt Puck rất đơn giản qua npm:
npm install @measured/puck.
- Tài liệu và mã nguồn đầy đủ có sẵn trên GitHub tại địa chỉ github.com/puckeditor/puck.
Stop using app stores for updates get them from the source instead
- Obtaining app updates directly from developers instead of app stores is inefficient.
- Obtainium allows users to subscribe to an app’s official release channels for instant APK updates.
- It automates sourcing and installing APK files from platforms like GitHub and GitLab.
- Users specify where app releases are published, and Obtainium checks for updates regularly.
- The tool installs APKs without using the Google Play Store or other marketplaces.
- Obtainium respects original release artifacts, ensuring users receive the intended files.
- It can parse release pages to find specific file names, simplifying the update process.
- Obtainium is not available on app stores and must be sideloaded from its GitHub repository.
- Users download the latest APK from the Releases section and allow installation from unknown sources.
- It is ideal for developers and users wanting immediate updates or for apps removed from stores.
- The tool promotes a decentralized approach to software distribution for those comfortable with side-loading.
An open-source alternative to CleanShot
- Better Shot là công cụ chụp màn hình và chú thích mã nguồn mở, nhẹ và tập trung vào quyền riêng tư.
- Công cụ cho phép chụp chọn vùng màn hình và thêm chú thích như mũi tên, hình chữ nhật, văn bản, và làm mờ thông tin nhạy cảm.
- Người dùng có thể sao chép hình ảnh vào clipboard hoặc lưu trực tiếp vào hệ thống tệp.
- Mã nguồn của Better Shot có sẵn trên GitHub, cho phép người dùng xem và chỉnh sửa theo nhu cầu riêng.
- Ứng dụng được phát triển bằng Tauri, sử dụng Rust cho backend và công nghệ web cho frontend, giúp ứng dụng nhỏ gọn và hiệu suất cao.
- UI của Better Shot sạch sẽ và không rối mắt, tránh tình trạng thừa tính năng làm chậm hiệu suất.
- Hướng dẫn sử dụng và cách xây dựng ứng dụng từ mã nguồn có sẵn trong README trên GitHub.
- Cần có Rust và Node.js để xây dựng ứng dụng.
Hacker News: Best
🔥 2025 was the third hottest year on record
🔥 The recurring dream of replacing developers
- Phát triển phần mềm gặp phải chu kỳ thất vọng kéo dài 50 năm giữa các doanh nghiệp và lập trình viên.
- Margaret Hamilton phát triển phần mềm dẫn đường cho Apollo trong sự kiện lịch sử năm 1969, chứng minh rằng phần mềm là vô cùng cần thiết (Apollo program).
- COBOL được giới thiệu vào thập kỷ 1960-1970 với hy vọng rằng các nhà phân tích kinh doanh có thể tự viết chương trình của mình.
- Thực tế cho thấy COBOL vẫn cần đào tạo chuyên sâu, và các lập trình viên COBOL mới xuất hiện.
- Đến thập kỷ 1980, công cụ Computer-Aided Software Engineering (CASE) hứa hẹn tăng năng suất nhưng phần lớn không thành công do yêu cầu can thiệp thủ công.
- Xuất hiện Visual Basic và Delphi vào thập kỷ 1990, giúp giảm bớt rào cản cho những người không có kinh nghiệm lập trình.
- Cuộc cách mạng này cho phép nhiều người tạo ứng dụng đơn giản, nhưng vẫn không loại bỏ được nhu cầu về lập trình viên có kinh nghiệm.
- Từ năm 2000 trở đi, các nền tảng web, low-code, và no-code tiếp tục xuất hiện, cung cấp giá trị thực cho việc phát triển phần mềm.
💬 ASCII characters are not pixels: a deep dive into ASCII rendering
- Tôi đang xây dựng một trình tạo hình ảnh thành ASCII, minh chứng bằng một ví dụ tương tác.
- Trình tạo tập trung vào việc làm cho các cạnh sắc nét, rõ ràng trong các hình ảnh, như hình lập phương xoay.
- Tôi triển khai hiệu ứng cel shading để cải thiện độ tương phản giữa các vùng màu sắc khác nhau.
- ASCII art thường không khai thác hình dạng của ký tự, dẫn đến các cạnh mờ.
- Việc sử dụng ký tự monospace giúp chia hình ảnh thành lưới, với mỗi ô chứa một ký tự ASCII.
- Có 95 ký tự ASCII có thể sử dụng, và tôi chọn 10 ký tự để ánh xạ theo độ sáng.
- Tôi sử dụng công thức để chuyển đổi giá trị RGB sang giá trị độ sáng (lightness).
- Phương pháp ánh xạ một giá trị độ sáng từ 0 đến 1 vào một ký tự trong danh sách CHARS rất đơn giản.
- Kỹ thuật downsampling gần nhất gây ra mờ và thiếu sắc nét cho các cạnh trong quá trình chuyển đổi hình ảnh.
🔥 PCs refuse to shut down after Microsoft patch
🔥 After 25 years, Wikipedia has proved that news doesn’t need to look like news
- Wikipedia không phải là một trang tin tức nhưng cung cấp nhiều bài học về cách xây dựng kiến thức chung về thế giới.
- Bản tin Weeklypedia hàng tuần tổng hợp những bài viết Wikipedia chỉnh sửa nhiều nhất, tiết lộ những thể loại bài viết phổ biến.
- Bài viết về sự kiện và tin tức thường được chỉnh sửa nhiều nhất, cho thấy mức độ cập nhật nhanh chóng khi có sự kiện lớn xảy ra.
- Wikipedia đã ghi nhận hàng triệu lần chỉnh sửa từ hàng trăm tác giả trong các sự kiện lớn như các cuộc tấn công tại Venezuela và các cuộc biểu tình ở Iran.
- Wikipedia ra đời cách đây 25 năm, tạo ra một nguồn thông tin phong phú từ sự cộng tác của hàng triệu người dùng.
- Nền tảng này xây dựng văn hóa làm việc và tiêu chuẩn biên tập rõ ràng, điều này khác biệt với nhiều trang wiki khác chưa thành công.
- Wikipedia khuyến khích việc cập nhật liên tục thông tin, không chỉ là viết lại bài viết mới mỗi ngày.
🔥 US electricity demand surged in 2025 – solar handled 61% of it
- Năng lượng mặt trời đã chiếm 61% tăng trưởng nhu cầu điện năng ở Mỹ trong năm 2025 (Ember).
- Nhu cầu điện ở Mỹ tăng 135 terawatt-giờ (TWh), đạt mức tăng 3,1%, đây là lần tăng lớn thứ tư trong vòng một thập kỷ.
- Sản lượng năng lượng mặt trời tăng 83 TWh, tương đương 27% so với năm 2024, là mức tăng lớn nhất trong bất kỳ nguồn năng lượng nào.
- Texas, Midwest và Mid-Atlantic là những khu vực có mức tăng trưởng năng lượng mặt trời lớn nhất và nhu cầu điện cao nhất.
- Năng lượng mặt trời đáp ứng 81% nhu cầu tăng trưởng ở Texas và Midwest, cũng như 33% ở Mid-Atlantic.
- Năng lượng mặt trời phủ toàn bộ sự gia tăng nhu cầu điện ở Mỹ trong khung giờ từ 10 giờ sáng đến 6 giờ chiều.
- Sự gia tăng của lưu trữ pin giúp năng lượng mặt trời trở nên linh hoạt, đáp ứng nhu cầu vào buổi tối.
- Sản lượng năng lượng mặt trời và lưu trữ pin ở California đã tăng 58% trong 6 năm qua.
- Hầu hết sản lượng năng lượng mặt trời mới trong năm 2025 đã được hấp thụ bởi nhu cầu điện đang tăng lên.
💬 Map To Poster – Create Art of your favourite city
- Tạo poster bản đồ tối giản cho bất kỳ thành phố nào trên thế giới.
- Các thành phố và chủ đề tiêu biểu gồm: San Francisco (sunset), Barcelona (warm_beige), Venice (blueprint), Tokyo (japanese_ink), Mumbai (contrast_zones), Marrakech (terracotta), Singapore (neon_cyberpunk), Melbourne (forest), Dubai (midnight_blue).
- Cài đặt bằng lệnh:
pip install -r requirements.txt.
- Sử dụng với lệnh:
python create_map_poster.py --city <city> --country <country> [options].
- Các tùy chọn bao gồm tên thành phố, tên quốc gia, chủ đề, bán kính bản đồ (default 29000m), và danh sách chủ đề.
- Có 17 chủ đề khả dụng trong thư mục themes/.
- Poster được lưu vào thư mục posters/ với định dạng
{city}_{theme}_{YYYYMMDD_HHMMSS}.png.
- Có thể thêm chủ đề tùy chỉnh bằng cách tạo tệp JSON trong thư mục themes/.
💬 ClickHouse acquires Langfuse
- ClickHouse đã mua lại Langfuse, mục tiêu vẫn là xây dựng nền tảng LLM engineering tốt nhất.
- Langfuse tiếp tục mở source và có khả năng tự host, không có thay đổi nào về giấy phép.
- Langfuse Cloud vẫn hoạt động như cũ với cùng sản phẩm và trải nghiệm người dùng.
- Khả năng hoạt động nhanh hơn nhờ vào sự hỗ trợ từ ClickHouse.
- Cải thiện hiệu suất và độ tin cậy nhờ làm việc với đội ngũ kỹ thuật của ClickHouse.
- Phát triển nhanh hơn về tuân thủ an ninh và compliance nhờ nguồn lực từ ClickHouse.
- Langfuse đã chuyển đổi từ Postgres sang ClickHouse để hỗ trợ tải cao hơn trong môi trường sản xuất.
- Langfuse và ClickHouse đã có mối quan hệ hợp tác chặt chẽ trước khi thỏa thuận mua lại.
- Langfuse đã giúp hàng ngàn đội ngũ làm quen với ClickHouse khi nâng cấp từ phiên bản 2 lên phiên bản 3.
💬 FLUX.2 [Klein]: Towards Interactive Visual Intelligence
- Hôm nay, chúng tôi phát hành họ mô hình FLUX.2 [klein], mô hình hình ảnh nhanh nhất hiện tại.
- FLUX.2 [klein] kết hợp giữa tạo ra và chỉnh sửa trong một kiến trúc nhỏ gọn, với thời gian suy diễn dưới 1 giây.
- Mô hình yêu cầu ít nhất 13GB VRAM và chạy trên phần cứng tiêu dùng như RTX 3090/4070.
- FLUX.2 [klein] cung cấp chất lượng vượt trội trong tạo ảnh từ văn bản, chỉnh sửa hình ảnh và tạo đa tham chiếu.
- Mô hình 9B có thời gian suy diễn dưới 0.5 giây, so với các mô hình lớn gấp 5 lần.
- Phiên bản được mã hóa FP8 và NVFP4 tối ưu hóa cho suy diễn trên GPU RTX, nhanh hơn và tiêu tốn ít VRAM hơn.
- Mô hình 4B hoàn toàn mở theo giấy phép Apache 2.0, thích hợp cho phát triển địa phương và ứng dụng trên biên.
- Các mô hình cơ sở 9B/4B có khả năng tùy chỉnh và đào tạo tốt hơn cho nghiên cứu và ứng dụng cụ thể.
- Mô hình FLUX.2 [klein] đã cho thấy hiệu suất vượt trội và có thể tạo ra nội dung chất lượng gần như tương đương với các mô hình lớn hơn.
- Tất cả các phiên bản đều có giấy phép tương ứng, Apache 2.0 cho 4B và FLUX NC cho 9B.
- FLUX.2 [klein] hướng tới một tương lai của trí thông minh hình ảnh tương tác, với các công cụ thiết kế thời gian thực và sáng tạo nội dung.
🔥 LWN is currently under the heaviest scraper attack seen yet
- LWN đang chịu một cuộc tấn công DDoS mạnh nhất từ trước đến nay, với hàng chục nghìn địa chỉ tham gia.
- Cuộc tấn công này ảnh hưởng nghiêm trọng đến khả năng phản hồi của trang web.
- Một số người tin rằng các công cụ tìm kiếm đang ưu tiên nội dung bị đánh cắp, gây tổn hại đến tác giả gốc.
- Các đối thủ có thể gây ra cuộc tấn công bao gồm Bright Data và các công ty tương tự.
- Nhiều người dùng đề nghị các biện pháp bảo vệ khác nhau, như sử dụng dữ liệu ngẫu nhiên để làm khó các bot.
- Một số người dùng trải nghiệm lượng truy cập tăng cao đến 20 lần so với bình thường, khả năng cũng do lưu lượng truy cập từ bot.
- Việc chuyển sang chỉ cho phép người dùng đã đăng ký cũng đang được xem xét như một kết quả khả thi để bảo vệ trang web.
How I Built a Donation Website in 8 Hours (And Why)
- Hoki.help là nền tảng quyên góp cho tổ chức hospice trẻ em HoKi NÖ tại Áo.
- HoKi hỗ trợ các gia đình có trẻ em mắc bệnh nghiêm trọng miễn phí.
- Dự án được hoàn thành trong khoảng 8 giờ.
- Sử dụng Next.js 14 với App Router cho khung ứng dụng.
- Thiết kế với Tailwind CSS, tài chính tích hợp qua Stripe Checkout.
- Cơ sở dữ liệu sử dụng Neon (Postgres không máy chủ).
- Các tính năng bao gồm widget quyên góp, tùy chọn ẩn danh và theo dõi quyên góp.
- Không cần tài khoản người dùng; quyên góp diễn ra nhanh chóng và dễ dàng.
- 100% số tiền quyên góp được chuyển đến HoKi NÖ.
- Tất cả chi phí lưu trữ do tác giả trang trải.
- Dữ liệu quyên góp chỉ được lưu lại ở châu Âu.
- Tích hợp các trang pháp lý và tối ưu hóa SEO cho nền tảng.
Title: LA Clippers Owner Steve Ballmer Faces Fraud Allegations Over Kawhi Leonard’s Compensation
- Chủ sở hữu LA Clippers, Steve Ballmer, đang đối mặt với cáo buộc gian lận liên quan đến bồi thường cho cầu thủ Kawhi Leonard.
- Một nhóm nhà đầu tư đã đệ đơn kiện, cáo buộc Ballmer và các bị đơn khác tham gia vào một kế hoạch chuyển tiền cho Leonard qua một công ty ngân hàng xanh đã ngừng hoạt động.
- Các khoản thanh toán này không được công khai rõ ràng với các nhà đầu tư, theo cáo buộc của các nguyên đơn.
- Luật sư của Ballmer cố gắng bác bỏ vụ kiện, cho rằng các khoản thanh toán cho Leonard là hợp pháp và đã được công khai đầy đủ.
- Nếu cáo buộc được chứng minh là đúng, LA Clippers có thể phải đối mặt với các hậu quả tài chính và tổn hại đến danh tiếng.
- Nếu vụ kiện bị bác bỏ, đây sẽ là một thắng lợi lớn cho Ballmer và LA Clippers.
- Kết quả của vụ kiện này có thể ảnh hưởng lớn đến cả đội bóng và cầu thủ ngôi sao Kawhi Leonard.
当 AI 变成我的”超强员工
- Tôi sử dụng AI frequentemente, mua gói cơ bản của Zhìpǔ.
- Mỗi ngày có hạn mức sử dụng, nếu vượt quá, tôi phải đợi 2-3 giờ để phục hồi.
- Tôi đã mua hai tài khoản để linh hoạt hơn khi một tài khoản vượt hạn mức.
- Sử dụng AI không chỉ để lập trình mà còn cho nhiều công việc không liên quan đến lập trình.
- Tôi đã dùng AI để viết phản hồi cho yêu cầu của bộ phận kiểm duyệt ứng dụng.
- Để AI thực hiện công việc tốt, cần cung cấp đầy đủ ngữ cảnh và chi tiết.
- Tôi tạo PPT cho bản báo cáo cuối năm với sự trợ giúp của AI bằng cách tổng hợp các hoạt động trong năm.
- Tôi lập một robot thông tin bằng cách sửa đổi một dự án mã nguồn mở, nhờ AI phân tích và chỉnh sửa mã.
- AI hỗ trợ tôi trong toàn bộ quy trình xuất bản plugin trên Chrome, từ nội dung đến hình ảnh.
- Tôi sử dụng AI để tạo các hình ảnh bìa cho tài khoản WeChat của mình và trong thiết kế sản phẩm.
- AI cho phép tôi đảm nhận nhiều vai trò hơn, không chỉ như một lập trình viên, mà còn là một người quản lý toàn diện.
- Công nghệ AI giúp cải thiện hiệu suất công việc và mở rộng khả năng của cá nhân phát triển.
Redacting Sensitive Data in Go’s slog: A Practical Guide with masq
- Logging là cần thiết cho việc gỡ lỗi, giám sát và kiểm toán.
- Logs có thể tiết lộ thông tin nhạy cảm như mật khẩu và API tokens.
- Việc loại bỏ thông tin nhạy cảm trong logs là rất khó khăn nếu logs được thiết kế không thay đổi.
- Gói log/slog của Go có interface LogValuer để tùy chỉnh cách giá trị xuất hiện trong logs.
- LogValuer hoạt động với giá trị trực tiếp nhưng không hiệu quả với các trường trong cấu trúc.
- Masq là thư viện mã nguồn mở giúp tự động redaction thông tin nhạy cảm trong logs.
- Masq sử dụng ReplaceAttr để kiểm tra và loại bỏ thông tin nhạy cảm, bao gồm các cấu trúc lồng nhau.
- Masq hỗ trợ nhiều chiến lược để xác định dữ liệu nhạy cảm: theo kiểu tùy chỉnh, theo struct tag, theo tên trường, và theo tiền tố trường.
The Simple Trick That Makes a List of 50,000 Render Smoothly
- Danh sách lớn (50,000 mục) có thể gây nặng nề cho trình duyệt do nhiều DOM nodes cần được tính toán và vẽ lại.
- Virtual DOM là một đại diện trong bộ nhớ của DOM thực, giúp cải thiện hiệu suất bằng cách giảm thiểu việc vẽ lại và thay đổi trực tiếp DOM thực.
- Khi có số lượng lớn mục (ví dụ: 1,000), bộ nhớ của React có thể trở nên nặng nề với nhiều đối tượng, làm chậm quá trình render.
- Việc vượt quá 16ms cho mỗi khung hình có thể dẫn đến tình trạng dropped frames, đặc biệt trên thiết bị di động có tài nguyên hạn chế.
- Memoization không làm giảm số lượng phần tử mà trình duyệt cần xử lý, mà chỉ ngăn React chạy lại mã và logic.
- API lý tưởng nên cho phép phân trang, lọc hoặc tìm kiếm để giảm số lượng kết quả, nhưng không phải lúc nào cũng có quyền kiểm soát.
- Giao diện người dùng có thể chịu trách nhiệm không render tất cả dữ liệu cùng một lúc; chỉ hiển thị những gì có thể nhìn thấy hoặc trì hoãn công việc cho đến khi người dùng tương tác.
- Kỹ thuật “windowing” (virtualization) giúp chỉ render những gì hiển thị trên màn hình, giảm tải công việc cho trình duyệt.
Stop Feeding “Junk” Tokens to Your LLM. (I Built a Proxy to Fix It)
- Tôi đã xây dựng một agent để thực hiện các tác vụ SRE như fetch logs và query databases.
- Khi kiểm tra traces, tôi nhận thấy sự không hiệu quả, đặc biệt liên quan đến lượng tokens lớn chỉ chứa thông tin lặp lại.
- Một lệnh tìm kiếm Python files dùng 40,000 tokens, trong đó 35,000 token là các cụm từ lặp lại như “type”: “file” và “language”: “python”.
- Tôi phát triển một công cụ gọi là Headroom, một lớp tối ưu hóa ngữ cảnh, giúp nén ngữ cảnh tới 85% mà không mất nghĩa.
- Headroom sử dụng phương pháp phân tích thống kê, không chỉ đơn giản là cắt giảm thông tin (truncation).
- SmartCrusher có các bước như Constant Factoring, Outlier Detection, Error Preservation, Relevance Scoring và First/Last Retention để duy trì thông tin quan trọng.
- Quy trình CCR (Compress-Cache-Retrieve) cho phép nén dữ liệu nhưng vẫn có thể lấy lại thông tin khi cần thiết.
- TOIN (Tool Output Intelligence Network) theo dõi các mẫu nén để cải thiện hiệu suất nén cho các lần sử dụng sau.
- Dữ liệu của người dùng được bảo mật với việc không lưu trữ giá trị thực tế, chỉ lưu tên cấu trúc và mã hóa.
- Headroom giúp cải thiện lưu trữ và truy xuất thông tin giữa các cuộc hội thoại cho agent.
New Year, New You Portfolio Challenge: THE OTHER SIDE
- Robert Ishoka là một nhà phát triển di động với 4 năm kinh nghiệm, nhấn mạnh đến trải nghiệm người dùng và tương tác mượt mà.
- Dự án portfolio của anh lấy cảm hứng từ “Stranger Things,” với mong muốn tạo ra một không gian tương tác giống như một thế giới song song.
- Anh muốn người dùng di chuyển qua một không gian thay vì chỉ cuộn qua danh sách kỹ năng.
- Tất cả các yếu tố như bố cục, màu sắc, kiểu chữ và chuyển động đều được suy nghĩ cẩn thận để cảm giác như một thế giới sống động.
- Tech Stack bao gồm Flutter (Web), flutter_riverpod (v2+), và Google Cloud Run (Docker + Nginx).
- Thách thức lớn nhất trong việc phát triển là tạo cảm giác vật lý cho cuộn và chuyển tiếp giữa các chiều không gian.
- Sử dụng công cụ Antigravity từ Google AI để hỗ trợ trong việc xây dựng kiến trúc và gỡ lỗi.
- Có một chế độ phát triển bí mật “Konami” cho phép truy cập hệ thống và tải xuống phiên bản đầy đủ của hồ sơ.
- Engine chuyển đổi chiều không gian cho phép thay đổi đồng thời màu sắc, kiểu chữ và hành vi tương tác mà không làm rơi khung hình.
- Dự án đã thúc đẩy anh vượt ra ngoài vùng an toàn cả về mặt kỹ thuật và sáng tạo.
Why I Make Claude Argue With Itself Before Writing Code
- Claude tạo ra mã nhưng không hiểu ngữ cảnh của mã gốc, dẫn đến sai sót (retry logic không phù hợp, cấu hình logging toàn cầu, không kiểm soát số trang tối đa).
- Mã có vẻ chuyên nghiệp nhưng dựa trên những giả định sai lầm (không hiểu biết thực sự).
- Phương pháp truyền thống “Just Code It” có hạn chế: AI đoán mà không có ngữ cảnh, không có sự tranh luận, và lập tức thực hiện ý tưởng đầu tiên.
- Phân tích theo cấu trúc trước khi viết mã giúp tránh việc giao hàng ý tưởng đầu tiên.
- Tạo cuộc trò chuyện có cấu trúc giữa các vai trò: lập kế hoạch (Peter), phản biện (Neo), xây dựng (Gary), và rà soát (Reba).
- Mỗi vai trò tương tác và thách thức nhau trong quá trình thực hiện kế hoạch.
- Mã được viết sau khi đã trải qua quá trình tranh luận và thẩm định.
- Bộ kỹ năng mã hóa Claude đã được xây dựng theo mô hình làm việc nhóm (open source).
- Người dùng có thể clone bộ kỹ năng từ GitHub và thực hiện tác vụ bằng cách cung cấp lệnh cho Claude.
Arch Linux Running Slow? Here’s How to Actually Fix It
- Nếu hệ thống Arch Linux của bạn chạy chậm với RAM và CPU tối đa ngay cả khi không làm gì nhiều, bạn cần chẩn đoán vấn đề trước khi dọn dẹp.
- Sử dụng htop hoặc top để kiểm tra những tiến trình đang tiêu tốn tài nguyên.
- Check chi tiết sử dụng RAM và CPU bằng lệnh ps aux với tùy chọn sắp xếp.
- Một số thủ phạm phổ biến gồm: quá trình của desktop environment (KDE Plasma và GNOME), tab trình duyệt (Firefox hoặc Chrome) và dịch vụ chỉ mục nền (baloo_file, tracker-miner).
- Kiểm tra dung lượng log hệ thống với journalctl và thu dọn nếu cần thiết.
- Kiểm tra tình trạng swap và các dịch vụ đang gặp lỗi bằng lệnh swapon và systemctl.
- Dọn dẹp bộ nhớ cache bằng các lệnh sudo pacman và rm để giải phóng không gian lưu trữ, nhưng điều này không giải quyết vấn đề hiệu suất.
- Để xử lý tốc độ chậm, cần tìm và xử lý tiến trình sử dụng nhiều tài nguyên.
- Thiết lập dọn dẹp cache tự động và giới hạn kích thước log để duy trì hiệu suất.
- Tránh phụ thuộc vào các ứng dụng dọn dẹp mà hãy tìm hiểu và giải quyết nguyên nhân cụ thể khiến hệ thống chậm.
EIOC Guard™ Runbook: SOC‑Style Emotional Incident Response
- Phần 3 của chuỗi EIOC cung cấp một phương pháp vận hành cho hệ thống cảm xúc con người.
- Kích hoạt runbook khi có dấu hiệu như mờ đục tư duy, cảm giác áp lực hay sự tan rã ranh giới.
- Phân loại mức độ nghiêm trọng theo thang SEV từ 1 (Chỉ số nghiêm trọng) đến 4 (Chỉ số thấp).
- Quy trình phát hiện ban đầu bao gồm xác nhận tín hiệu, xác định nguồn gốc, phân loại mức độ và leo thang nếu cần.
- Phân tích chuỗi giết cảm xúc giúp hiểu rõ hơn về sự cố.
- Quy trình chứa chấp bao gồm kiềm hãm nhận thức, ranh giới và mối quan hệ.
- Quy trình loại bỏ gồm xác định và vô hiệu hóa các công cụ, đồng thời loại bỏ đường dẫn truy cập.
- Quy trình phục hồi tập trung vào làm rõ tư duy, khôi phục ranh giới và mối quan hệ.
- Đánh giá sau sự cố nên được thực hiện trong vòng 24-48 giờ.
- Củng cố lâu dài bao gồm ranh giới, nhận thức và mối quan hệ.
- Đóng sự cố khi không có EIOCs trong 72 giờ và đã hoàn tất đánh giá sau sự cố.
- Khung EIOC trở nên khả thi ở mọi phương diện: quan sát, phát hiện và bảo vệ.
Why Most Developers Get Bad AI Output (And How I Fixed It in VS Code)
- Nhiều nhà phát triển gặp phải kết quả không mong muốn với AI tools như ChatGPT và Claude do prompt không rõ ràng (lý do chính không phải là mô hình).
- Các prompt thường thiếu ngữ cảnh, ràng buộc và mong đợi rõ ràng, khiến AI phải đoán để tạo ra câu trả lời, dẫn đến kết quả sai lệch.
- PromptLint là một extension cho VS Code giúp cấu trúc lại các prompt thành các hướng dẫn rõ ràng và chuyên nghiệp.
- PromptLint tự động thêm vai trò, nhiệm vụ rõ ràng, yêu cầu, ràng buộc và định dạng đầu ra.
- PromptLint tích hợp trực tiếp vào VS Code, cho phép người dùng cải thiện prompt mà không làm gián đoạn quy trình làm việc.
- Công cụ này hoạt động với OpenAI, Claude và các API tương thích khác.
- PromptLint được thiết kế cho các nhà phát triển sử dụng AI hàng ngày và kỹ sư viết prompt kỹ thuật.
- Chất lượng prompt là yếu tố không thể thiếu khi sử dụng AI nghiêm túc.
Why Service Mesh Never Took Off (Despite Being Incredibly Powerful)
- AWS giới thiệu App Mesh tại re:Invent, mang lại lợi ích quan trọng cho microservices.
- Service mesh cung cấp khả năng hiển thị tức thời lưu lượng truy cập giữa các dịch vụ.
- Nó giúp xác định nút thắt hiệu năng trong 50-200 microservices nhanh chóng.
- Service mesh tự động khắc phục sự cố, cho phép bất kỳ ai phát hiện sự cố, không chỉ kỹ sư SRE cao cấp.
- Cung cấp bảo mật không tin cậy (zero-trust) với mTLS giữa tất cả các dịch vụ.
- Circuit breakers trong Istio giúp quản lý quá tải, ngăn chặn sự cố từ việc gửi yêu cầu không cần thiết.
- Việc sử dụng service mesh dẫn đến sự phức tạp trong vận hành khi thêm sidecar proxy cho mỗi pod.
- Chi phí cao là yếu tố chính khiến nhiều đội ngũ từ bỏ service mesh, với tăng chi phí 30-90% cho khối lượng tính toán.
- Dữ liệu giám sát lớn từ service mesh yêu cầu chi phí tăng cao cho các dịch vụ như AWS X-Ray.
- Service mesh phù hợp cho tổ chức lớn và yêu cầu bảo mật nghiêm ngặt, nhưng không thích hợp cho nhóm nhỏ và môi trường nhạy cảm về chi phí.