Simon Willison’s Weblog
Spotlighting The World Factbook as We Bid a Fond Farewell
- The CIA has officially discontinued The World Factbook, a publication active since 1971 (CIA announcement).
- The entire site and its archives have been removed, redirecting all pages to a closure announcement.
- The World Factbook was made public domain from the beginning and should have retained archived versions for public access.
- Annual zip file archives were published by the CIA until 2020, available on the Internet Archive.
- An archived copy of the 2020 Factbook has been uploaded to a GitHub repository (simonw/cia-world-factbook-2020).
- The new height of Mount Everest is 8,848.86 meters, adjusted from 8,848 meters due to a 2015 earthquake (December 10, 2020 update).
Voxtral transcribes at the speed of sound
- Mistral vừa phát hành Voxtral Transcribe 2 với hai mô hình mới, một mô hình có trọng số mở.
- Voxtral Realtime (Voxtral-Mini-4B-Realtime-2602) có trọng số mở, dung lượng 8.87GB, có thể tải về từ Hugging Face.
- Người dùng có thể thử nghiệm mô hình trực tiếp qua live demo, cho phép nhận diện âm thanh và chuyển đổi thành văn bản tức thời.
- Mô hình có trọng số đóng có tên là voxtral-mini-latest, truy cập qua Mistral API.
- Gọi API để chuyển đổi âm thanh thành văn bản sử dụng cURL với tham số như model, file, diarize, context_bias, và timestamp_granularities.
- Mistral API console có playground cho speech-to-text, cho phép tải lên file âm thanh và nhận kết quả phiên âm có phân biệt người nói.
- Kết quả phiên âm có thể tải về định dạng văn bản, SRT hoặc JSON.
Distributing Go binaries like sqlite-scanner through PyPI using go-to-wheel
- Ngày 4 tháng 2 năm 2026, tác giả khám phá Go để xây dựng ứng dụng nhị phân nhỏ, nhanh và độc lập.
- Công cụ CLI mới có tên sqlite-scanner quét hệ thống tệp để tìm các tệp cơ sở dữ liệu SQLite.
- sqlite-scanner kiểm tra 16 byte đầu tiên của tệp để xác định tính hợp lệ của chúng với định dạng SQLite.
- Công cụ hỗ trợ tìm kiếm đệ quy trong nhiều thư mục và sử dụng goroutines song song để tăng tốc độ quét.
- Kết quả được xuất ra dưới dạng văn bản đơn giản, JSON hoặc JSON phân cách bằng dòng.
- Người dùng có thể cài đặt sqlite-scanner qua pip hoặc uv, cho phép sử dụng dưới dạng gói Python.
- Các tệp nhị phân đã biên dịch cho sqlite-scanner được phân phối qua PyPI dựa trên hệ điều hành và kiến trúc.
- Tác giả đã xây dựng một plugin mới cho Datasette có tên datasette-scan, phụ thuộc vào sqlite-scanner.
- Vòng lặp chính trong sqlite-scanner tìm và thực thi tệp nhị phân đã đóng gói khi gói Python được thực thi.
- Việc sử dụng gói Python để phân phối nhị phân Go giúp tích hợp tính năng Go vào các gói Python khác.
The Pragmatic Engineer
The third golden age of software engineering – thanks to AI, with Grady Booch
- Hiện tại, chúng ta đang ở giữa “thời kỳ vàng thứ ba của kỹ thuật phần mềm.” (Grady Booch)
- Ngành kỹ thuật phần mềm đã trải qua nhiều cuộc khủng hoảng tồn tại và luôn tiến hóa.
- Ngành này còn rất trẻ, chỉ mới khoảng 70 năm tuổi.
- Công cụ AI không phải là sự kết thúc của kỹ thuật phần mềm mà là sự gia tăng trừu tượng.
- Các công cụ AI hiện tại chủ yếu được đào tạo trên những mẫu vấn đề đã biết, đặc biệt là các hệ thống CRUD.
- Nền tảng kiến thức sâu sắc trở nên quan trọng khi lĩnh vực này phát triển nhanh chóng.
- Hệ thống cơ sở hạ tầng và quy trình phân phối phần mềm sẵn sàng cho tự động hóa và có thể dẫn đến mất việc làm.
- Sự chuyển đổi hiện tại từ các chương trình sang các hệ thống yêu cầu kỹ sư hiểu biết về phức tạp ở quy mô lớn.
- AI giúp chuyển hướng sự chú ý từ những rắc rối sang trí tưởng tượng trong phát triển sản phẩm.
- Đây là thời gian để phát triển và tỏa sáng, không phải để sợ hãi.
Martin Fowler
Fragments: February 4
- Sự kiện do Thoughtworks tổ chức ở Deer Valley, Utah, theo định dạng Open Space, thu hút nhiều ý tưởng giá trị.
- Lo ngại sử dụng AI làm giảm hiểu biết của con người về hệ thống họ tạo ra được thảo luận.
- Pair Programming khuyến khích việc giải thích, giúp tăng cường học hỏi cho người dạy.
- Một SRE cho một Very (Very) Large Code Base nhận thấy LLM giúp anh hiểu rõ hơn về mã nguồn.
- Tin tưởng hoàn toàn vào kết quả của LLM là sai lầm, nhưng việc sử dụng LLM để định hướng thông tin là hợp lý.
- Drew Breunig đề xuất phần mềm tương lai có thể chỉ là specs mà không cần mã nguồn.
- Bruce Schneier đặt câu hỏi về vai trò của quảng cáo khi tương tác với LLM và mối liên quan giữa quảng cáo và nội dung.
- Thực trạng Minnesota cho thấy sự leo thang bạo lực từ các lực lượng vũ trang, trong khi chính trị gia không can thiệp.
- Người dân Minnesota kháng cự một cách hòa bình, thể hiện tính đoàn kết và hỗ trợ lẫn nhau.
- Tình hình Minnesota cho thấy sức mạnh của cộng đồng đa dạng, chống lại bạo lực và những hiểu lầm về sự ưu việt xã hội.
Open Source Projects - Latest Discoveries
Unify your npm Maven PyPI Docker and Hugging Face registries instantly
A minimalist framework to build and understand AI agents locally
Track the Codex situation with a lightweight open-source desktop application
The open-source tool to automate your entire DevOps pipeline
Manus is incredible, but OpenManus can achieve any idea without an Invite Code
Bridge your Antigravity sessions directly to your mobile device instantly
The definitive self-hosted alternative to proprietary office suites
Turn any HTML snippet into a formatted Microsoft Word document instantly
I Know This Will Upset Some Devs, but Tailwind + Shadcn/ui + Shadow DOM = Pain
Coordination Is the Substrate: What NVIDIA’s Groq Acquisition Really Signals About AI Governance
Why WebSockets Are Overkill for Most Real-Time Apps
Why We Built 9 Agent Kits in 1 Day
The Best Ways to Build a Blog in Rails 8: From Markdown to Action Text
Mix with the Masters: Mixing Night with Ken Lewis - STUDIO HEALTH NIGHT - 2/4/26
When will AI replace Software Developers?
Where Do You Stand in the AI Era: Understanding User Patterns
AWS Enterprise Production Architecture – End-to-End DevOps Project
🛩 Beginner-Friendly Guide ‘Trionic Array II’ - Problem 3640 (C++, Python, JavaScript)
Custom Code vs. Ready-Made PHP Scripts: When is Which Worth It?
I built Skillradar: find the right agent skill by describing your task (2.5k+ indexed)
Hacker News: Best
🔥 How Jeff Bezos Brought Down the Washington Post
🔥 The Great Unwind
🔥 AI is killing B2B SaaS
🔥 Voxtral Transcribe 2
🔥 A case study in PDF forensics: The Epstein PDFs
🔥 FBI couldn’t get into WaPo reporter’s iPhone because Lockdown Mode enabled
🔥 Guinea worm on track to be 2nd eradicated human disease; only 10 cases in 2025
🔥 Claude is a space to think
💬 Show HN: Ghidra MCP Server – 110 tools for AI-assisted reverse engineering
💬 Petition for Recognition of Work on Open-Source as Volunteering in Germany
Krebs on Security
Please Don’t Feed the Scattered Lapsus ShinyHunters
Who Operates the Badbox 2.0 Botnet?
Daring Fireball
OpenAI’s Codex
iDiallo.com
We installed a single turnstile to feel secure
Pluralistic: Daily links from Cory Doctorow
Pluralistic: Justin Key’s “The Hospital at the End Of the World” (04 Feb 2026)
Terence Eden’s Blog
Book Review: The Examiner - Janice Hallett ★★★★⯪
Xe Iaso’s blog
Did Zendesk get popped?
The Old New Thing
Super Bowl LX creates an opportunity for symphonic friendly wagering
How can I prevent the user from changing the widths of ListView columns?
🍵 Giles’ blog
Writing an LLM from scratch, part 32a – Interventions: training a baseline model
Andrew Nesbitt
Package Management at FOSDEM 2026
Computer Things
Logic for Programmers New Release and Next Steps
Jim Nielsen’s Blog
Saying “No” In an Age of Abundance
The Silicon Underground
Radio Shack’s 2015 bankruptcy
Troy Hunt
Weekly Update 489
Anil Dash
New York Tech at 30: the Crossroads
Miguel Grinberg’s Blog
Date Arithmetic in Bash