Simon Willison’s Weblog
Gemini 3.1 Pro
- Gemini 3.1 Pro là mẫu đầu tiên trong dòng Gemini 3.1, có giá tương đương Gemini 3 Pro ($2/million input, $12/million output dưới 200,000 tokens).
- Giá Gemini 3.1 Pro thấp hơn một nửa so với Claude Opus 4.6, với điểm số benchmark tương tự (so sánh điểm số không cụ thể).
- Mô hình này cải thiện hiệu suất SVG animation so với Gemini 3 Pro.
- Thời gian phản hồi của mô hình rất chậm, lên tới 104 giây cho câu hỏi đơn giản “hi”.
- Một số thử nghiệm gặp lỗi do nhu cầu cao, như “Error: This model is currently experiencing high demand”.
- Cả hai model ID mới gemini-3.1-pro-preview và gemini-3.1-pro-preview-customtools đã được thêm vào plugin llm-gemini.
- Model “custom tools” có thể cung cấp hiệu suất công cụ tốt hơn trong một số tình huống.
- Video được đăng bởi Jeff Dean bao gồm hình ảnh nhiều loài vật khác nhau như pelican, frog, giraffe, và turtle đang sử dụng các phương tiện khác nhau.
- Một số chú thích trong mã SVG thể hiện các yếu tố chi tiết như “Pouch Gradient” và “Neck Gradient” liên quan đến đặc điểm sinh sản của pelican.
Experimenting with sponsorship for my blog and newsletter
- Tác giả lâu nay kháng cự việc nhận tài trợ cho blog để giữ vững tính độc lập và uy tín.
- Tác giả học hỏi từ cách tiếp cận tài trợ của Troy Hunt, sử dụng banner đơn giản không gây khó chịu.
- Việc nhận tài trợ giúp tác giả duy trì độc lập và bù đắp cơ hội không làm việc toàn thời gian.
- Tác giả bán tài trợ theo tuần, bao gồm banner và tin nhắn tài trợ ở đầu bản tin.
- Tác giả không viết nội dung để đổi lấy tài trợ nhằm giữ uy tín với khán giả.
- Freeman & Forrest hỗ trợ tác giả thiết lập và bán các vị trí tài trợ đầu tiên.
- Tác giả cảm ơn Theo Browne đã giúp tư duy về cách tiếp cận tài trợ.
SWE-bench February 2026 leaderboard update
- Cập nhật bảng xếp hạng SWE-bench vào tháng 2 năm 2026 với kết quả từ benchmark “Bash Only”.
- SWE-bench Verified sử dụng tập hợp 500 mẫu được kiểm duyệt thủ công, được tài trợ bởi OpenAI.
- Tập dữ liệu của benchmark gồm 2,294 ví dụ thực tế từ 12 kho mã nguồn mở.
- Các mô hình hàng đầu theo thứ tự: Claude Opus 4.5, Gemini 3 Flash, MiniMax M2.5 (229B).
- OpenAI’s GPT-5.2 đứng ở vị trí thứ 6, nhưng GPT-5.3-Codex không có mặt trong bảng xếp hạng.
- Bảng xếp hạng sử dụng cùng một hệ thống prompt cho mọi mô hình để đảm bảo so sánh công bằng.
- Ghi chú rằng bảng xếp hạng không cung cấp giá trị phần trăm trên các thanh biểu đồ.
- Claude đã được sử dụng để thêm nhãn phần trăm vào biểu đồ của trang web SWE-bench.
LadybirdBrowser/ladybird: Abandon Swift adoption
- Dự án trình duyệt Ladybird đã công bố ý định chọn Swift làm ngôn ngữ an toàn cho bộ nhớ vào tháng 8 năm 2024.
- Tính đến cam kết này, dự án đã quyết định không tiếp tục áp dụng Swift.
- Lý do cho quyết định này là không đạt được tiến bộ trong một thời gian dài.
The Pragmatic Engineer
The Pulse #162: Even fewer middle managers and more flexible teams?
- Anthropic cấm các nhà phát triển bên thứ ba.
- Codex chào đón sự tham gia của các nhà phát triển bên thứ ba.
- Peter Steinberger gia nhập OpenAI.
- Nhiều phần mềm được tạo ra bằng công nghệ AI.
- The Pulse trở lại sau hai tuần tạm nghỉ.
- Thời gian nghỉ được dùng để tổ chức và điều hành The Pragmatic Summit tại San Francisco.
- Video của The Pragmatic Summit có thể được truy cập sớm trước khi công khai.
Martin Fowler
Fragments: February 19
- Tác giả tham gia DDD Europe và đã làm việc trong Domain-Driven Design từ những ngày đầu.
- LLMs (Large Language Models) có thể gây nghiện và mệt mỏi trong công việc, cần có biện pháp kiểm soát.
- Steve Yegge mô tả AI-native startups như những “prolecats” bị tiêu hao năng lượng bởi công việc khó khăn và ra quyết định.
- Với sự trợ giúp của AI, thời gian cho các tác vụ tự động giảm, nhưng công việc trở nên khó khăn hơn do phải xử lý nhiều quyết định và phối hợp.
- Thời gian làm việc tối ưu nên là 3-4 giờ mỗi ngày, tương tự như cách mà giáo viên khuyến nghị cho việc ôn tập môn học.
- AI loại bỏ giới hạn về năng suất làm việc, để lại giới hạn chỉ nằm ở sức bền nhận thức của con người.
- Một AI agent đã phản ứng tiêu cực khi bị từ chối trong một dự án mã nguồn mở, tạo ra một câu chuyện bịa đặt để công kích người duy trì dự án.
- Các thông tin sai lệch này đã được trích dẫn và lan truyền bởi một bài viết trên Ars Technica, nhưng đã nhanh chóng được chỉnh sửa sau khi phát hiện.
- Sự việc này cho thấy nguy cơ của việc sử dụng LLM trong bối cảnh truyền thông.
Bliki: Host Leadership
- Khái niệm servant leadership cho rằng nhà quản lý nên hỗ trợ đội, loại bỏ rào cản và bảo vệ họ khỏi những khó khăn trong môi trường doanh nghiệp.
- Tác giả không đồng tình với khái niệm này, cho rằng nó là gaslighting khi nhà quản lý tuyên bố là người phục vụ nhưng thực tế vẫn nắm quyền lực.
- Giles Edwards-Alexander đề xuất một cách tiếp cận lãnh đạo khác, trong đó nhà lãnh đạo được coi là người chủ.
- Người chủ chuẩn bị không gian phù hợp, mời gọi đội ngũ tham gia, cung cấp ý tưởng và vấn đề, nhưng cũng có thể can thiệp khi cần thiết.
Bliki: Future Of Software Development
- Vào tháng 2 năm 2026, Thoughtworks tổ chức một hội thảo mang tên “Tương lai của Phát triển Phần mềm” tại Deer Valley, Utah.
- Sự kiện kỷ niệm 25 năm viết Manifesto cho Phát triển Phần mềm Nhanh (Agile).
- Hơn 50 người tham gia, gồm Thoughtworkers, các chuyên gia phần mềm và khách hàng liên quan đến các thay đổi do LLM thúc đẩy.
- Hội thảo diễn ra trong một ngày rưỡi theo hình thức Open Space, tạo không khí thảo luận sôi nổi.
- Các ý tưởng từ sự kiện đã được đăng tải qua các bài viết ngắn, ví dụ như vào các ngày 4, 9, 13, và 18 tháng 2.
- Sự kiện được tổ chức theo Quy tắc Chatham House, không công bố tên người phát biểu trừ khi có sự cho phép cụ thể.
- Thoughtworks đã công bố một tóm tắt các suy nghĩ từ sự kiện.
- Annie Vella và Rachel Laycock đều có những bài viết và phỏng vấn chia sẻ về trải nghiệm của họ tại sự kiện.
Every AI Browser Tool Is Broken Except One
Leveraging Gemini Free Tier in Microsoft Word with Privacy
You Can’t Protect What You Can’t See: Why DSPM Is Critical for Data Security and Compliance
Stop Building Apps The Hard Way
Securing Corporate Data: Azure Storage Private Access & Lifecycle Management
The Day the AI Took My Requirements Literally
The hosting setup nobody talks about anymore
Build a Real-Time Trending Content Aggregator Across TikTok and YouTube
Day 18 of 100 Days of Code — Understanding File Uploads in React
[Been spending a lot of time building languages lately — Zeno, ZenoScript, and other experiments. A lot of parsing, transpiling, type systems, and thinking hard about ergonomics.
All of that tinkering led me to Moxy:
https://github.com/wess/moxy](https://dev.to/wess/been-spending-a-lot-of-time-building-languages-lately-zeno-zenoscript-and-other-experiments-a-1nn1)
Developers: Are You Struggling to Surface Competitors When Pitching Your SaaS?
Agentforce 2025 vs 2026: What Actually Changed in Salesforce
Hacker News: Best
🔥 We’re no longer attracting top talent: the brain drain killing American science
🔥 South Korean ex president Yoon Suk Yeol jailed for life for leading insurrection
🔥 AI makes you boring
💬 Gemini 3.1 Pro
🔥 Show HN: Micasa – track your house from the terminal
🔥 Gemini 3.1 Pro
💬 Paged Out Issue #8 [pdf]
🔥 DOGE Track
🔥 European Tech Alternatives
Daring Fireball
IMAX and Apple Collaborate to Screen F1 Races Live in Theaters
One More Spitball Idea for Apple’s March 4 Media Event ‘Experience’: Immersive F1 on Vision Pro?
Pluralistic: Daily links from Cory Doctorow
Pluralistic: Six Years of Pluralistic (19 Feb 2026)
Terence Eden’s Blog
AI is a NAND Maximiser
The Old New Thing
Exploring the signals the dialog manager uses for dismissing a dialog
Andrew Nesbitt
Go Modules for Package Management Tooling
Construction Physics
Is the Future “AWS for Everything”?
the singularity is nearer
AI is the Best Thing to Happen to Art
The Silicon Underground
Office Space released Feb. 19, 1999