Simon Willison’s Weblog
Open Responses
- Open Responses là nỗ lực tiêu chuẩn hóa trong lĩnh vực LLM, cung cấp một thông số kỹ thuật không lệ thuộc vào nhà cung cấp cho JSON API.
- Nó dựa trên OpenAI’s Responses API, với tính năng được thiết kế cho các mô hình gần đây như reasoning traces.
- Danh sách đối tác ra mắt bao gồm OpenRouter, Hugging Face, LM Studio, vLLM, Ollama và Vercel, mở rộng khả năng tương thích với nhiều mô hình hiện có.
- Open Responses có một phần của bài kiểm tra tuân thủ độc lập với ngôn ngữ, có thể sử dụng src/lib/compliance-tests.ts trong kho lưu trữ chính thức.
- Tại website chính thức, có ứng dụng React cho phép kiểm tra thực hiện server qua CORS.
- Chưa có tương đương cho phía client, tác giả dự định phát triển thư viện client riêng cho Python với mục tiêu kiểm tra độ chính xác.
The Design & Implementation of Sprites
- Sprites là những máy tính disposable, cho phép người dùng dễ dàng tạo ra máy tính trong thời gian ngắn (Thomas Ptacek).
- Fly Machines mới có thể mất tới khoảng một phút để provision, nhưng Sprites giải quyết vấn đề này bằng cách giữ các pool máy chưa sử dụng ở nhiều khu vực khác nhau.
- Mỗi Sprite chạy từ một container tiêu chuẩn, giúp các máy tính có thể chuẩn bị sẵn sàng mà không cần phải làm việc nặng nhọc.
- Sprites chỉ tính phí cho dữ liệu mà người dùng ghi lại khác với hình ảnh cơ bản và cung cấp khả năng checkpointing và restores trong khoảng ~300ms.
- Hệ thống lưu trữ của Sprites sử dụng một filesystem tùy chỉnh trên lưu trữ tương thích S3 và được điều phối bởi metadata SQLite đồng bộ hóa với Litestream.
- NVMe được sử dụng như bộ nhớ cache đọc qua cho blob trên lưu trữ đối tượng, không phải là nguồn gốc của lưu trữ.
- Kiến trúc lưu trữ của Sprites được tổ chức dựa trên mô hình JuiceFS, với dữ liệu được chia thành “chunks” và metadata giúp xác định vị trí của các “chunks”.
- Chunks dữ liệu được lưu trữ trên các dịch vụ lưu trữ đối tượng, trong khi metadata được giữ trong bộ nhớ cục bộ nhanh.
Tech World With Milan Newsletter
Software Development Waste
- Nhiều người nhận thấy rằng nếu có kinh nghiệm trước đây, dự án phần mềm có thể hoàn thành nhanh hơn.
- Trong tư duy lean, “waste” được định nghĩa là bất kỳ hoạt động nào không mang lại giá trị từ góc nhìn của khách hàng.
- Bảy loại waste truyền thống trong phát triển phần mềm được Poppendieck xác định gồm: công việc chưa hoàn thành, tính năng thừa, việc tái học, chuyển giao, chờ đợi, chuyển đổi ngữ cảnh, và sai sót.
- Ngoài bảy waste chính, nghiên cứu của Sedano et al. mở rộng danh sách lên chín loại bao gồm: tính năng sai, quản lý backlog kém, quá mức trong kỹ thuật, tải nhận thức, căng thẳng tâm lý, giao tiếp không hiệu quả, và lãng phí mã từ mã do AI tạo ra.
- Các thực hành để giảm waste bao gồm: tạo sự visible cho waste qua value stream mapping, kiểm soát thrashing bằng WIP limits, chia sẻ kiến thức để ngăn ngừa tái học, và giảm chuyển giao thông qua đội ngũ đa chức năng.
- Công việc chưa hoàn thành giống như tồn kho phần mềm và tạo ra sự không chắc chắn.
- Tính năng thừa phát sinh từ việc phát triển những yếu tố không cần thiết, làm tăng chi phí và độ phức tạp.
- Việc tái học gây lãng phí kiến thức do thiếu tài liệu hoặc sự chia sẻ thông tin kém.
- Chuyển giao thông tin giữa các thành viên có thể dẫn đến mất mát thông tin và sai sót.
- Sự chờ đợi trong quy trình phát triển phần mềm là một dạng lãng phí.
- Một khi đã nhận thức được các loại waste, các kỹ sư và nhà quản lý có thể xác định và giảm thiểu chúng trong quy trình làm việc.
The Pragmatic Engineer
The Pulse #159: Long-running agents and orchestrating lots of them
- Xu hướng năm nay là thử nghiệm với agent orchestration và long-running agents.
- Các dự án và thí nghiệm sẽ đẩy mạnh khả năng của agents trong năm nay, với ví dụ sớm từ Cursor.
- Claude Code ngăn cấm OpenCode trong khi Codex chấp nhận nó.
- “The Pulse” là một loạt bài viết về sự kiện, hiểu biết, và xu hướng trong Big Tech và startups.
Open Source Projects - Latest Discoveries
Turn a photo of any key into a 3D-printable key.
- KeyForge3D là dự án mã nguồn mở biến ảnh 2D của chìa khóa thành mô hình 3D sẵn sàng in (STL file).
- Công cụ này sử dụng Python và OpenCV để tự động hóa quá trình nhận diện và chiết xuất hình dạng chìa khóa.
- Người dùng chỉ cần chụp ảnh chìa khóa trên nền tương phản đơn giản và chạy script Python để nhận kết quả.
- Dự án có mục đích rõ ràng và repository dễ sử dụng với script chính và ví dụ đầu ra cụ thể.
- KeyForge3D hiệu quả với nhiều loại chìa khóa thông dụng và minh họa được cách kết nối giữa cấu trúc pixel và vật thể thực.
- Người dùng cần có Python và OpenCV được cài đặt để thử nghiệm công cụ này.
- Hãy tham khảo repository để biết thêm chi tiết về phụ thuộc và các giới hạn hiện tại về loại chìa khóa.
Control Spotify playback from your terminal with full features
- spotify-player là ứng dụng terminal mã nguồn mở điều khiển Spotify từ command line.
- Ứng dụng được phát triển bằng Rust, cung cấp giao diện người dùng tương tác bên trong terminal.
- Hỗ trợ đầy đủ các chức năng phát nhạc như phát, tạm dừng, bỏ qua, thay đổi âm lượng và tìm kiếm bài hát.
- Cho phép quản lý danh sách phát và tùy chỉnh giao diện theo sở thích cá nhân.
- Chạy độc lập, không chỉ là một API wrapper đơn giản.
- Yêu cầu tài khoản Spotify Premium để hoạt động.
- Cài đặt dễ dàng thông qua Cargo bằng lệnh: cargo install spotify-player.
- Hỗ trợ xác thực qua OAuth khi lần đầu sử dụng để đăng nhập vào tài khoản Spotify.
- Cung cấp hướng dẫn phím tắt trên màn hình để người dùng dễ dàng điều hướng.
Build reliable and open source web crawlers
- Crawlee là thư viện mã nguồn mở từ Apify, hỗ trợ xử lý cơ sở hạ tầng của web scraping và crawling.
- Thư viện quản lý các phần khó như HTTP request queuing, tự động retry, proxy rotation và browser automation.
- Người dùng có thể sử dụng nhiều phương pháp crawling khác nhau, bao gồm HTTP requests và headless browsers như Puppeteer và Playwright, thông qua API thống nhất.
- Dữ liệu của crawl được lưu trữ trên filesystem hoặc kho lưu trữ khác, giúp người dùng có thể dừng và khởi động lại crawler mà không mất dữ liệu.
- Crawlee tự động xử lý retries với exponential backoff và quản lý các cookie phiên và cấu hình proxy để tránh bị chặn.
- Thư viện sử dụng TypeScript hiện đại, dễ sử dụng và có tài liệu phong phú với ví dụ cụ thể.
- Người dùng có thể bắt đầu dự án mới dễ dàng với npm bằng cách sử dụng lệnh npx crawlee create my-crawler.
- Duy trì mã nguồn mở cho phép người dùng kiểm tra, đóng góp và điều chỉnh theo nhu cầu của mình mà không bị ràng buộc vào nền tảng kín.
- Crawlee giúp giảm thiểu khối lượng công việc nặng nề và vấn đề phải viết lại mã nhiều lần trong quá trình phát triển crawler.
- Thư viện phù hợp cho các nhà phát triển cần xây dựng crawler nghiêm túc cho thu thập dữ liệu, giám sát, kiểm thử hoặc tự động hóa.
Build multilingual OCR into your Python applications with 80+ languages
- EasyOCR là thư viện Python giúp phát hiện và nhận diện văn bản từ hình ảnh, hỗ trợ hơn 80 ngôn ngữ.
- Thư viện sử dụng mô hình deep learning kết hợp giữa CRAFT (model phát hiện văn bản) và CRNN với ResNet và LSTM (model nhận diện văn bản).
- Người dùng chỉ cần cung cấp đường dẫn hình ảnh, thư viện sẽ trả về văn bản cùng với tọa độ bounding box cho mỗi từ hoặc dòng văn bản.
- EasyOCR có thể chạy trên CPU mà không cần GPU, nhưng việc kích hoạt GPU với CUDA sẽ cải thiện tốc độ xử lý.
- Thư viện cung cấp kết quả dưới dạng danh sách các chuỗi văn bản và vị trí bounding box, hữu ích cho việc phân tích bố cục tài liệu.
- Tài liệu hướng dẫn trên GitHub chi tiết, có ví dụ rõ ràng cho các tình huống sử dụng cơ bản và xử lý hàng loạt.
- Bắt đầu sử dụng EasyOCR chỉ cần cài đặt qua pip và viết một vài dòng mã để đọc văn bản từ hình ảnh.
Monitor and debug Kubernetes network traffic in real-time with this open source tool
- Kubeshark là công cụ mã nguồn mở cung cấp cái nhìn trực tiếp về lưu lượng mạng nội bộ trong Kubernetes.
- Kubeshark chạy dưới dạng DaemonSet, cài đặt agent trên mỗi nút trong cluster để bắt giữ lưu lượng mạng.
- Nó ghi lại các giao thức API như HTTP, HTTPS, AMQP, Kafka và Redis và hiển thị thông tin trong giao diện web.
- Người dùng có thể xem yêu cầu và phản hồi theo thời gian thực, lọc theo không gian tên, pod hoặc giao thức.
- Kubeshark không yêu cầu thay đổi trong mã nguồn hoặc cấu hình triển khai của người dùng.
- Nó hỗ trợ gỡ lỗi các vấn đề API, phân tích hiệu suất và đánh giá bảo mật.
- Cài đặt Kubeshark dễ dàng với Helm chart, chỉ cần vài lệnh là có thể hoạt động.
- Người dùng có thể theo dõi lưu lượng mạng mà không gặp phải cản trở nào.
- Kubeshark không thay thế logging hay metrics, nhưng bổ sung quý giá cho việc giám sát lưu lượng giao tiếp giữa các dịch vụ.
- Nó giúp các nhà phát triển nắm rõ thông tin trong giao tiếp giữa các dịch vụ mà không cần viết nhiều dòng mã gỡ lỗi.
An AI-powered blog designed to help you review and retain knowledge.
- Modernblog là một dự án mã nguồn mở kết hợp AI để cải thiện việc ghi nhớ thông tin qua blog.
- Dự án cung cấp một động cơ blog tự lưu trữ có trợ lý AI tích hợp.
- AI tạo ra các câu hỏi ôn tập dựa trên nội dung bài viết mà người dùng vừa đọc.
- Quá trình tích hợp hỗ trợ việc ghi nhớ thông tin thông qua “testing effect”.
- Nội dung câu hỏi được tạo ra từ bài viết cụ thể, không phải từ cơ sở dữ liệu chung.
- Dự án thiết kế hướng đến nhà phát triển, có thể tùy chỉnh và mở rộng dễ dàng.
- Người dùng kiểm soát dữ liệu và khóa API AI, không cần rời khỏi cấu hình cá nhân.
- Mã nguồn đầy đủ có sẵn trên GitHub, yêu cầu thiết lập cục bộ để thử nghiệm.
- Người dùng cần cấu hình khóa API AI của riêng mình để sử dụng tính năng tạo câu hỏi.
- Modernblog là ví dụ về việc sử dụng AI cho mục đích thực tiễn, thay vì chỉ là tính năng nổi bật.
- Dự án khuyến khích người dùng khám phá các tương tác tích cực với AI trong tài liệu và hướng dẫn.
- Repo là điểm khởi đầu tốt để xây dựng tương lai với AI trong giáo dục và học tập.
Create beautiful animated SVG banners for your GitHub profile.
- GitHub profile là trang chủ của lập trình viên, thường là điểm đầu tiên người khác xem xét công việc của bạn.
- Tool readme-animated-sweetbanner cho phép tạo banner SVG động cho README GitHub.
- Cung cấp cấu hình cơ bản như văn bản, màu sắc và kiểu animation để xuất file SVG tự chứa.
- Banner sử dụng animation SVG (SMIL), nhẹ, có thể mở rộng mà không mất chất lượng và hoạt động mượt mà trên trình duyệt hiện đại.
- Có nhiều kiểu animation khác nhau và cho phép tùy chỉnh bảng màu và văn bản.
- Để tạo banner, bạn cần fork hoặc clone repo, chỉnh sửa file config.json, chạy script (node index.js) để tạo file sweetbanner.svg.
- Nhúng SVG vào README bằng thẻ hình ảnh:
.
- Dự án giúp tạo điểm nhấn thị giác đơn giản mà không cần am hiểu sâu về cú pháp animation SVG.
Load test your web applications using a modern and open source CLI tool
- oha là một công cụ tải HTTP mã nguồn mở, được viết bằng Rust và hoạt động trên dòng lệnh.
- Nó cho phép người dùng gửi một lượng lớn yêu cầu HTTP đến một URL mục tiêu và báo cáo các chỉ số quan trọng như tổng số yêu cầu, tỷ lệ thành công, phân bố độ trễ.
- oha sử dụng kiến trúc async tokio, giúp tạo tải nặng mà không làm chậm công cụ kiểm tra.
- Giao diện người dùng thời gian thực của oha rất trực quan, tự động làm mới và cho phép người dùng theo dõi thông số tải ngay lập tức.
- oha hỗ trợ HTTP/1.1 và HTTP/2, cho phép đặt tiêu đề tùy chỉnh và gửi nội dung JSON dễ dàng.
- Cài đặt oha rất đơn giản, chỉ cần tải xuống tệp nhị phân duy nhất mà không cần phụ thuộc hay cài đặt phức tạp.
- Cú pháp cơ bản để chạy kiểm tra rất rõ ràng và dễ hiểu.
Build markdown slideshows directly in your terminal
- Presenterm là công cụ trình bày dựa trên terminal, chuyển đổi file Markdown thành slideshow (mã nguồn: Rust).
- Hỗ trợ nhiều định dạng slide, hình ảnh và ghi chú cho người thuyết trình.
- Quy trình làm việc không cản trở: chỉ cần chỉnh sửa file Markdown trong bất kỳ trình soạn thảo nào.
- Sử dụng ba dấu gạch ngang (—) để phân tách các slide.
- Giải pháp nhẹ, nhanh và di động, không gặp vấn đề về font chữ hay bố cục.
- Ghi chú riêng cho mỗi slide giúp người thuyết trình theo dõi mà không gây rối mắt cho người xem.
- Cách cài đặt đơn giản qua Cargo hoặc tải file nhị phân từ GitHub Releases.
- Có thể điều khiển trình chiếu bằng phím mũi tên, phím cách hoặc n/p.
Simplify messaging between distributed Go services with NATS
- NATS là hệ thống messaging dành cho môi trường cloud-native, giúp các dịch vụ giao tiếp dễ dàng và nhanh chóng.
- Thư viện nats.go là client Go chính thức cho NATS, cho phép kết nối và gửi/nhận tin nhắn qua các subject.
- NATS hỗ trợ các mẫu messaging cơ bản: publish/subscribe, request/reply và queueing cho load balancing.
- Các dịch vụ không cần biết địa chỉ mạng của nhau; chỉ cần giao tiếp qua các subject được đặt tên.
- NATS thiết kế đơn giản, hiệu suất cao, dễ sử dụng và hỗ trợ nhiều tính năng từ TLS đến JetStream.
- Bắt đầu sử dụng nats.go chỉ mất khoảng một phút với cú lệnh đơn giản.
- Ví dụ về mã cho publisher và subscriber cho thấy cách gửi và nhận tin nhắn.
- NATS có khả năng chịu lỗi cao với khả năng clustering và tự động kết nối lại cho client.
- Thư viện nats.go là giải pháp lý tưởng cho microservices, giúp giảm bớt sự phức tạp trong hệ thống phân tán.
Build a local audio transcription tool using Whisper
- Buzz là ứng dụng máy tính để bàn cho Windows, macOS và Linux, sử dụng mô hình Whisper của OpenAI để phiên âm và dịch âm thanh trên máy tính cá nhân.
- Tất cả quá trình phiên âm diễn ra tại chỗ, đảm bảo dữ liệu âm thanh không rời khỏi máy tính, nâng cao bảo mật và quyền riêng tư.
- Ứng dụng hỗ trợ hoạt động offline và có thể xuất phiên âm dưới dạng văn bản thuần túy hoặc các tệp phụ đề (SRT, VTT).
- Buzz không yêu cầu người dùng thiết lập môi trường Python hay quản lý phụ thuộc, chỉ cần tải xuống và cài đặt ứng dụng từ GitHub.
- Người dùng chỉ cần tải về mô hình Whisper một lần, dung lượng có thể từ vài trăm MB đến vài GB tùy vào mô hình được chọn.
- Giao diện người dùng được tối giản, cho phép người dùng tải lên tệp âm thanh hoặc video và nhấn nút phiên âm để nhận kết quả.
- Buzz là ví dụ điển hình về việc biến mô hình AI phức tạp thành ứng dụng dễ sử dụng, phục vụ cho nhiều đối tượng như nhà báo, nghiên cứu, sinh viên và podcaster.
Hacker News: Best
🔥 ‘ELITE’: The Palantir app ICE uses to find neighborhoods to raid
- Palantir phát triển công cụ cho ICE để xác định mục tiêu trục xuất bằng cách sử dụng bản đồ và hồ sơ cá nhân (404 Media).
- Công cụ này cung cấp “confidence score” cho địa chỉ hiện tại của các cá nhân bị nghi ngờ (404 Media).
- Giao diện giống như Google Maps, hiển thị độ phong phú của khu vực dựa trên mật độ người nhập cư.
- Khi chọn một người trên bản đồ, ELITE hiển thị hồ sơ cá nhân bao gồm tên, hình ảnh, số Alien Number, ngày sinh, và địa chỉ đầy đủ.
- Palantir tạo ra phần mềm hỗ trợ việc trục xuất mà không có quy trình pháp lý đầy đủ, gây lo ngại về đạo đức (404 Media).
- Nhân viên làm việc tại Palantir, dù cảm thấy hài lòng với công việc và đồng nghiệp, có thể phải đối diện với mâu thuẫn về mặt giá trị cá nhân.
🔥 Ask HN: How can we solve the loneliness epidemic?
- Có một số lượng lớn người cảm thấy cô đơn hàng ngày và không thể tham gia các nhóm địa phương.
- Để giải quyết vấn đề này, người cần chủ động sáng tạo hoạt động và mời gọi người khác tham gia.
- Việc giữ liên lạc thường xuyên và sử dụng nhắc nhở tự động có thể giúp duy trì tình bạn.
- Sự thành công trong việc tạo dựng mối quan hệ có thể dưới 50%, nhưng không nên từ bỏ.
- Nhiều người cũng đang chật vật với cảm giác cô đơn, một số có thể chỉ đang chờ mời gọi từ người khác.
- Việc tổ chức các buổi gặp mặt xã hội cần sự hợp tác từ nhiều phía, không chỉ một người.
- Xu hướng thực tế cho thấy người ta thường ít có thói quen mời gọi tổ chức, dẫn đến cảm giác mệt mỏi cho người tổ chức.
- Có những rào cản như kỳ vọng cao từ truyền thông xã hội, khó khăn trong việc tổ chức sự kiện lần đầu và thiếu không gian công cộng để gặp gỡ.
- Nhiều địa điểm tổ chức đã bị tư nhân hóa, làm giảm khả năng tiếp cận cho mọi người.
🔥 Apple is fighting for TSMC capacity as Nvidia takes center stage
- CC Wei thông báo cho Apple về việc tăng giá lớn nhất trong nhiều năm của TSMC vào tháng 8 năm ngoái.
- Apple không còn giữ vị trí khách hàng lớn nhất của TSMC; Nvidia có thể đã vượt lên trong một hoặc hai quý năm ngoái.
- Do sự bùng nổ AI, Apple cần cạnh tranh để có được công suất sản xuất từ TSMC.
- Doanh thu của TSMC tăng 36% lên 122 tỷ USD trong năm ngoái, trong khi doanh thu của Nvidia dự kiến tăng 62%.
- Doanh thu sản phẩm của Apple (không bao gồm dịch vụ) chỉ tăng 3,6% trong 12 tháng tới tháng 12 năm 2025.
- Doanh thu từ máy tính hiệu suất cao, bao gồm chip AI, tăng 48% trong năm ngoái.
- TSMC có biên lợi nhuận gộp 62,3%, cao hơn 280 điểm cơ bản so với quý trước.
- TSMC dự kiến tăng trưởng doanh thu trung bình 25% trong năm năm tới, với phân khúc AI tăng trưởng 55% hoặc hơn.
- Apple vẫn quan trọng đối với TSMC ít nhất trong một thập kỷ tới, nhưng cần cạnh tranh với Nvidia và AMD trong ngắn hạn.
- TSMC đã bắt đầu sản xuất chip tại công nghệ 2 nanometer (N2) và sắp tới sẽ cho ra mắt N2P và A16.
🔥 The Palantir app helping ICE raids in Minneapolis
- Palantir phát triển công cụ cho ICE, bản đồ hóa mục tiêu trục xuất tiềm năng.
- Công cụ hiển thị hồ sơ cá nhân và điểm “confidence score” về địa chỉ của họ.
- ICE sử dụng công cụ để xác định các khu vực có nhiều người có thể bị giam giữ.
- Địa chỉ của người dân được lấy từ Bộ Y tế và Dịch vụ Nhân sinh (HHS) và các nguồn khác.
- Các tài liệu nội bộ của ICE cho thấy mối liên hệ rõ ràng giữa hạ tầng công nghệ của Palantir và hoạt động của ICE.
- DHS đầu tư thêm hàng trăm nhân viên liên bang đến Minneapolis trong bối cảnh có biểu tình lớn.
- Trong “Operation Metro Surge”, một nhân viên ICE đã bắn và giết công dân Mỹ Renee Nicole Good.
🔥 25 Years of Wikipedia
- Bài viết có thể tìm thấy tại URL: https://wikipedia25.org.
- Tổng số điểm là 413.
- Số lượng bình luận là 357.
- Các bình luận có thể xem tại URL: https://news.ycombinator.com/item?id=46632023.
🔥 Photos capture the breathtaking scale of China’s wind and solar buildout
- Năm ngoái, Trung Quốc lắp đặt hơn một nửa toàn bộ năng lượng gió và mặt trời được thêm vào toàn cầu (2022).
- Trong tháng 5, Trung Quốc lắp đặt năng lượng tái tạo đủ để cung cấp cho Ba Lan, với tốc độ khoảng 100 tấm năng lượng mặt trời mỗi giây.
- Sự phát triển này diễn ra trên toàn quốc, từ các thành phố đông đúc phía đông đến các sa mạc phía tây.
- Nhiếp ảnh gia Weimin Chu đã dành ba năm qua để ghi lại sự chuyển mình này bằng cách chụp ảnh từ trên không.
- Công việc của Chu được truyền cảm hứng từ ngôn ngữ hình ảnh của hội họa mực Trung Quốc truyền thống và đã được trưng bày trong một triển lãm đoạt giải.
- Chu nhận thấy các trang trại gió và nhà máy điện mặt trời xuất hiện thường xuyên trong ống kính khi ông đi đến Guizhou, Yunnan và Qinghai năm 2022.
🔥 Raspberry Pi’s New AI Hat Adds 8GB of RAM for Local LLMs
- Raspberry Pi ra mắt AI HAT+ 2 với giá 130 USD, có Hailo 10H và 8 GB RAM LPDDR4X.
- Hailo 10H cho phép chạy Large Language Models (LLMs) độc lập, tiết kiệm CPU và RAM cho Raspberry Pi.
- Chip này tiêu thụ tối đa 3W và đạt 40 TOPS hiệu suất suy luận INT8.
- Hailo 10H không thể nâng cấp RAM trên Raspberry Pi.
- Hiệu suất của CPU Raspberry Pi cao hơn Hailo 10H trong hầu hết các bài kiểm tra.
- Hailo 10H chỉ gần tương đương CPU Pi trên mô hình Qwen2.5 Coder 1.5B.
- Nhiều mô hình trung bình yêu cầu 10-12 GB RAM, giới hạn khả năng LLM trên Raspberry Pi với 8 GB.
- Hailo 10H có thể thực hiện xử lý hình ảnh tốt nhưng không phải là lựa chọn tốt nhất cho LLM cục bộ.
- AI HAT+ 2 hữu dụng cho phát triển nhưng chưa có nhiều ứng dụng phổ biến.
- Thí nghiệm với Camera Module 3 cho thấy khả năng phát hiện vật thể nhanh hơn 10 lần so với CPU Pi.
🔥 To those who fired or didn’t hire tech writers because of AI
- Năm 2025 đã chứng kiến sự phức tạp trong việc sử dụng AI, với nhiều người, kể cả người sáng lập OpenAI, cảm thấy bị lạc lối.
- AI không thể thay thế các kỹ sư viết tài liệu (technical writers) vì nó thiếu sự thấu cảm và không thể hiểu cảm giác của người dùng.
- Tài liệu (docs) là sự thật của sản phẩm, và không có chúng, phần mềm sẽ trở nên không sử dụng được.
- Kỹ sư viết tài liệu làm việc chăm chỉ để mang lại sự rõ ràng và có ảnh hưởng cho sản phẩm, chạy theo các thông tin sản phẩm quan trọng.
- Tài liệu do AI tạo ra thiếu trí thông minh và không thể phát triển chiến lược tài liệu, dẫn đến sản phẩm không có chiều sâu và thông tin thiếu chính xác.
- Trách nhiệm pháp lý vẫn tồn tại mặc dù tài liệu được viết bởi AI; người chịu trách nhiệm cuối cùng sẽ là con người.
- Việc tăng cường sức mạnh cho các kỹ sư viết tài liệu bằng công cụ AI có thể mang lại lợi ích, nhưng cần có chính sách chất lượng nội dung hợp lý.
- Cần phát triển một chiến lược AI cho tài liệu cùng với các kỹ sư viết tài liệu để họ có thời gian và nguồn lực thử nghiệm AI.
🔥 The URL shortener that makes your links look as suspicious as possible
💬 Crafting Interpreters
- “Crafting Interpreters” hướng dẫn người đọc xây dựng một ngôn ngữ lập trình hoàn chỉnh và hiệu quả.
- Người học sẽ tiếp thu các khái niệm cao cấp về parsing (phân tích) và semantics (ngữ nghĩa) cùng với chi tiết về bytecode representation (biểu diễn bytecode) và garbage collection (quản lý bộ nhớ).
- Bắt đầu từ hàm main(), người học phát triển một ngôn ngữ với các tính năng như rich syntax (cú pháp phong phú), dynamic typing (typ động), garbage collection, lexical scope (phạm vi từ), first-class functions (hàm bậc nhất), closures, classes (lớp), và inheritance (kế thừa).
- Nội dung được đóng gói trong vài nghìn dòng mã nguồn rõ ràng và nhanh chóng, tất cả đều do người học viết.
- Sách có sẵn dưới bốn định dạng khác nhau.
Multi-agent coding pipeline: Claude Code + Codex collaborate for higher accuracy and reliable deliverables [Open Source]
- Claude Codex là một plugin cho Claude Code, hỗ trợ quy trình xem xét mã nguồn bằng nhiều AI.
- Mỗi đoạn mã được kiểm tra bởi ba AI khác nhau: Claude Sonnet, Claude Opus và Codex.
- Claude Sonnet phát hiện lỗi cơ bản và vấn đề về bảo mật đơn giản.
- Claude Opus tìm kiếm lỗi tinh vi và các trường hợp biên.
- Codex cung cấp góc nhìn hoàn toàn khác so với hai AI trên.
- Mã nguồn không được chấp nhận cho đến khi cả ba AI đều đồng ý.
- Claude Codex kiểm tra 10 điểm bảo mật phổ biến theo OWASP.
- Gói cung cấp kế hoạch thực hiện trước khi viết mã để tiết kiệm chi phí sửa lỗi.
- Có tài liệu hướng dẫn đầy đủ dành cho người mới bắt đầu.
- Claude Codex hỗ trợ trên các nền tảng Windows, macOS và Linux.
- Pháp lý của dự án là GPL-3.0, miễn phí và mã nguồn mở.
Stop Guessing if Your AI Works: A Complete Guide to Evaluating and Monitoring on Bedrock
I. Đánh giá mô hình
- Amazon Bedrock cung cấp công cụ đánh giá tích hợp cho mọi mô hình sử dụng trên nền tảng này.
- Các phương pháp đánh giá bao gồm tự động đánh giá, đánh giá con người, LLM-as-judge và đánh giá RAG.
- Bedrock cung cấp ba loại điểm chính: Độ chính xác, Độ bền và Độc hại.
- Bạn có thể đánh giá các tác vụ như phản hồi chung, tóm tắt, hỏi đáp hoặc phân loại văn bản.
II. Rào cản: Ngăn chặn mô hình hoạt động sai lầm
- Rào cản giúp ngăn chặn nội dung có hại, cố gắng jailbreak và các cuộc tấn công tinh vi.
- Bạn có thể chặn các chủ đề không mong muốn, từ ngữ xấu và thông tin cá nhân.
- Chính sách rào cản được áp dụng tự động mà không cần thêm công việc.
III. Khung AI có trách nhiệm
- AI có trách nhiệm xem xét độ tin cậy và mục đích của hệ thống AI.
- Các yếu tố quan trọng bao gồm Công bằng, Giải thích, Bảo mật và Quyền riêng tư, An toàn, Kiểm soát, Độ chính xác, Quản trị, và Minh bạch.
- Công cụ của Bedrock và SageMaker hỗ trợ đánh giá các khía cạnh này để đảm bảo AI hoạt động đáng tin cậy.
IV. Giám sát mô hình
- Sau khi triển khai mô hình, cần theo dõi hiệu suất và tình trạng hoạt động.
- Sử dụng Invocation Logs để ghi lại các cuộc gọi mô hình và CloudWatch Metrics để theo dõi hiệu suất theo thời gian thực.
- CloudTrail đảm bảo lưu vết hoạt động trên nền tảng AWS để tuân thủ và khắc phục lỗi.
My Portfolio Using Next.js, Google Cloud Run and Gemini AI
- Dự án tham gia thách thức New Year, New You Portfolio Challenge của Google AI.
- Portfolio là ứng dụng full-stack Next.js 14 viết bằng TypeScript, áp dụng kiến trúc server-centric hiện đại.
- Tech Stack bao gồm: Frontend (Next.js, React, Tailwind CSS, Shadcn/UI), Backend (Next.js API Routes), và Cloud Firestore cho cơ sở dữ liệu.
- Sử dụng Upstash Redis để tối ưu hiệu suất và Firebase Authentication để bảo mật và quản lý quyền truy cập.
- Ứng dụng được triển khai trên Google Cloud Run qua dịch vụ Firebase App Hosting.
- Tích hợp Google AI với hai tính năng: Chatbot AI (Neneh) và AI Cover Letter Generator.
- Chatbot cho phép người dùng hỏi về kỹ năng và kinh nghiệm của tôi một cách tương tác.
- AI Cover Letter Generator tự động tạo thư xin việc dựa trên mô tả công việc và thông tin từ hồ sơ của tôi.
- Tự hào về khả năng xây dựng hai tính năng AI và kiến trúc dữ liệu hiệu quả nhằm tạo ra backend có thể mở rộng và bền vững.
🚀 Jetty Project Generator (Java) – Live
- Dự án Jetty project generator tạo dự án Jetty sẵn sàng sử dụng.
- Sử dụng Embedded Jetty với cấu trúc rõ ràng (servlets, cấu hình cổ điển).
- Phù hợp cho các bản demo, API nhẹ và dự án thân thiện với mã nguồn cũ.
- Sử dụng Java và Jetty, không sử dụng Spring Boot hay các công cụ không cần thiết.
- Link để thử nghiệm: https://jetty.appdte.cl/
I Built OrderSafe: A Tool to Help You Order Healthier at Fast Food Restaurants
- Tôi xây dựng OrderSafe, một ứng dụng web cung cấp gợi ý về các lựa chọn ăn uống lành mạnh tại các chuỗi fast food phổ biến.
- Ứng dụng cho phép người dùng chọn nhà hàng như Chick-fil-A, McDonald’s, Subway, Chipotle và Taco Bell.
- OrderSafe cung cấp thông tin dinh dưỡng quan trọng như protein, calo và các lựa chọn nên tránh.
- Dữ liệu trong ứng dụng được xác minh từ các trang dinh dưỡng chính thức của nhà hàng.
- OrderSafe được xây dựng bằng Base44, một nền tảng không cần mã hóa.
- Chương trình hiện đang ở giai đoạn thử nghiệm beta và cần phản hồi từ khoảng 100 người dùng.
- Kế hoạch tương lai bao gồm việc thêm nhiều nhà hàng, bộ lọc chế độ ăn kiêng và các gợi ý cá nhân hóa.
🚀 Generador de proyectos Jetty (Java) – en vivo
- Jetty là một generator dự án cho Java web không sử dụng framework nặng.
- Nó tạo ra các dự án Jetty sẵn sàng để sử dụng.
- Sử dụng Jetty nhúng (embedded Jetty).
- Cấu trúc rõ ràng với servlets và cấu hình cổ điển.
- Thích hợp cho các demo, API nhẹ và dự án tương thích với legacy.
- Tiếp cận sử dụng Java + Jetty với quyền kiểm soát toàn bộ stack.
- Không sử dụng Spring Boot và không có tính năng không cần thiết.
- Link để truy cập: https://jetty.appdte.cl/.
I’m New
- Forem Feed bao gồm nhiều Subforems để cá nhân hóa trải nghiệm người dùng.
- DEV Community với mục đích thảo luận về phát triển phần mềm và quản lý sự nghiệp.
- Future tập trung vào các tin tức và thảo luận về khoa học và công nghệ như AI, VR, và tiền mã hóa.
- Open Forem là không gian thảo luận chung cho cộng đồng Forem.
- Music Forem dành cho những người yêu thích âm nhạc và nội dung liên quan đến âm nhạc.
- Vibe Coding Forem thảo luận về phát triển AI và chia sẻ các dự án.
- Security Forem là trung tâm thông tin về bảo mật, bao gồm hacking đạo đức và phát triển nghề nghiệp.
- Golf Forem tập hợp những người yêu thích chơi golf.
- Crypto Forem là cộng đồng hợp tác về các chủ đề liên quan đến tiền mã hóa và phân tích thị trường.
- Parenting cung cấp không gian chia sẻ cho các bậc phụ huynh về việc nuôi dạy trẻ.
- Forem Core thảo luận về dự án phần mềm mã nguồn mở Forem.
- Maker Forem phục vụ cho những người sáng tạo và đam mê công nghệ như Arduino, Raspberry Pi, và in 3D.
- HMPL.js Forem dành cho các nhà phát triển sử dụng HMPL.js để xây dựng ứng dụng web nhanh và nhẹ.
The Set-and-Forget Guide to Rails App Versioning
- Gem rails_app_version giúp quản lý và hiển thị thông tin phiên bản và môi trường của ứng dụng.
- Để cài đặt, thêm gem vào Gemfile và chạy lệnh
bundle install.
- Sử dụng lệnh
rails app:version:config để sao chép cấu hình mặc định và tạo file VERSION tại thư mục gốc dự án với dòng echo "1.0.0" > VERSION.
- Kiểm tra bằng cách khởi động Rails console, phiên bản ứng dụng sẽ hiển thị trong banner chào mừng.
- Truy cập thông tin phiên bản qua
Rails.application.version và Rails.application.env.
- Gem tự động thêm các header X-App-Version và X-App-Environment vào mọi phản hồi HTTP.
- Nếu dự án là repository Git, gem có thể bao gồm SHA revision hiện tại trong chuỗi phiên bản.
- Sử dụng
Rails.application.version.to_cache_key để tạo khóa duy nhất cho Rails.cache.
- Tích hợp với Release Please để đồng bộ thông tin phiên bản qua file VERSION, giúp tự động tăng phiên bản và quản lý changelog.
- Release Please theo dõi các commit và tự động mở “Release PR” để tăng phiên bản trong file VERSION khi có thay đổi.
Part 1 : Building a Game in 30 Hours Using AI — Here’s the Actual Timeline
- Tôi đã xây dựng một trò chơi tên là MagLava trong khoảng 30 giờ với phương pháp lập trình nhanh và không lên kế hoạch chi tiết (tổng thời gian phát triển: ~25-35 giờ).
- Trò chơi là một nền tảng nam châm, gồm 25 cấp độ và hỗ trợ 7 ngôn ngữ.
- Tôi sử dụng AI như một đối tác phát triển, không phải chỉ đơn thuần là công cụ tự động hoàn thành.
- Ngày đầu tiên, tôi tạo ra 6,555 dòng mã cho cấu trúc dự án và các tính năng cơ bản.
- AI không chỉ giúp viết mã mà còn phát triển các hệ thống khác như trang web quảng bá và ứng dụng desktop.
- Tôi áp dụng phương pháp “vibe coding”, mô tả cảm xúc thay vì thông số kỹ thuật cụ thể, điều này giúp AI hiểu và thực hiện sửa chữa một cách hiệu quả.
- Quy trình phát triển đảo ngược: xây dựng trước, chơi thử, mô tả vấn đề, và lặp lại thay vì lên kế hoạch và thực hiện từng bước.
- Sự thay đổi trong thiết kế diễn ra nhanh chóng; ví dụ, tôi đã từ bỏ hệ thống di chuyển cũ chỉ sau một ngày thử nghiệm.
Significance of Python Virtual Environment (venv)
- Mỗi dự án Python cần các phiên bản thư viện khác nhau.
- Virtual Environment (venv) cách ly các phụ thuộc của mỗi dự án.
- Không có xung đột phiên bản khi sử dụng venv.
- Giúp giữ hệ thống Python sạch.
- Ngăn ngừa vấn đề “Nó hoạt động trên máy của tôi”.
- Venv cần thiết cho các dự án tự động hóa và Selenium.
- Hỗ trợ nhiều phiên bản Python khác nhau.
- Cải thiện khả năng hợp tác trong nhóm.
Gin vs Spring Boot: A Detailed Comparison
- Khi chọn backend framework, Gin (Go) và Spring Boot (Java) thường được so sánh về hiệu suất, khả năng mở rộng và hệ sinh thái.
- Gin là nền tảng web HTTP nhẹ, lý tưởng cho API và microservices hiệu suất cao.
- Spring Boot là framework ứng dụng đầy đủ, thích hợp cho các ứng dụng doanh nghiệp và microservices.
- Gin nhanh chóng do bản chất biên dịch của Go, trong khi Spring Boot mang lại hiệu suất đáng tin cậy cho các hệ thống lớn.
- Gin đơn giản hơn nhưng cần thiết lập thủ công cho các tính năng phức tạp; Spring Boot có công cụ phong phú và hỗ trợ tự động cấu hình.
- Gin sử dụng goroutines cho tính năng đồng thời hiệu quả; Spring Boot thừa hưởng từ Java với thread nặng hơn.
- Hỗ trợ sự kiện của Gin là tùy chỉnh, trong khi Spring Boot có hệ sinh thái mạnh mẽ cho event sourcing và CQRS.
- Cộng đồng của Gin là hoạt động nhưng nhỏ hơn; Spring Boot có cộng đồng lớn với hỗ trợ thương mại và mã nguồn mở.
- Gin là lựa chọn tốt cho microservices hiệu suất cao và hệ thống sự kiện nhẹ; Spring Boot phù hợp cho ứng dụng doanh nghiệp cần event sourcing.
Mr Sunday Movies: Every RoboCop Movie - Caravan of Garbage
- Series “Caravan of Garbage” khẳng định rằng phiên bản 1987 của Paul Verhoeven không thể bị vượt qua.
- Peter Weller trong vai RoboCop kết hợp giữa nhân tính, châm biếm và hành động bạo lực.
- Sequel RoboCop 2 (1990) có một số khoảnh khắc thú vị nhưng không đạt được sức hút của phiên bản đầu.
- Reboot RoboCop (2014) có một số điểm sáng, nhưng cũng không thể tái hiện ma thuật của bản gốc.
- RoboCop 3 (1993) bị đánh giá là “hạn chế rất nhiều” và được cho là không đạt yêu cầu.