Simon Willison’s Weblog
2025: The year in LLMs
- Năm 2025, nhiều xu hướng mới xuất hiện trong lĩnh vực LLM.
- “Reasoning” trở thành tính năng chính của các mô hình AI, bắt đầu từ OpenAI với các phiên bản o1 và o3 (2024-2025).
- Lần đầu tiên, các mô hình reasoning cho phép lập kế hoạch và thực hiện các nhiệm vụ đa bước hiệu quả.
- Các mô hình reasoning trở nên xuất sắc trong việc sản xuất và gỡ lỗi mã nguồn, giải quyết các lỗi phức tạp.
- “Agents” được định nghĩa là các hệ thống LLM chạy công cụ để đạt được mục tiêu.
- Có ít ví dụ về agents hoạt động trong năm 2024, nhưng đến năm 2025, chúng trở nên hữu ích hơn.
- Các mô hình reasoning có thể được điều chỉnh để tăng hoặc giảm mức độ reasoning cho từng yêu cầu.
- Mô hình LLM bây giờ có thể kết nối thành công với các công cụ tìm kiếm, mang lại kết quả chính xác hơn cho các câu hỏi phức tạp.
- Nhiều phòng thí nghiệm AI phát hành ít nhất một mô hình reasoning trong năm 2025.
- Mô hình LLM địa phương trở nên tốt hơn, nhưng mô hình đám mây thậm chí còn xuất sắc hơn.
Codex cloud is now called Codex web
- Codex cloud được đổi tên thành Codex web trong vài ngày qua.
- Thibault Sottiaux, trưởng nhóm kỹ thuật Codex OpenAI, phân biệt giữa cloud tasks và Codex web.
- Cloud tasks bao gồm các tác vụ chạy trên môi trường đám mây, như code review và tích hợp với các nền tảng như GitHub, Slack.
- Codex web là ứng dụng web của Codex.
- Codex trên ứng dụng iOS được gọi là Codex iOS.
- Sản phẩm tương đương của Anthropic tên là Claude Code trên web.
Stay SaaSy
2025: Another SaaSy Year In Review
- Năm qua, Stay SaaSy phát triển mạnh mẽ trên Substack, X và qua email.
- Cộng đồng của Stay SaaSy bao gồm nhiều nhà xây dựng, quản lý và lãnh đạo thú vị.
- AI là chủ đề chính trong năm, khiến nhiều lĩnh vực khác bị lùi lại, nhưng không bị biến mất.
- Blogging, quản lý, và SaaS chưa chết, chỉ đang thay đổi.
- Dự kiến sẽ có nhiều thay đổi trong blogging, quản lý và SaaS trong năm tới.
- Stay SaaSy tham gia vào podcast, mặc dù chưa được nhất quán và gặp một số phản hồi về việc sử dụng voice modulators.
- Podcast sẽ tiếp tục được phát triển trong năm tới với phần mềm cải thiện giọng nói.
- Năm 2025, OpenAI thử nghiệm trả 1/10 nhân viên với 10 lần lương và có dấu hiệu thành công.
- Sự gia tăng năng suất với AI mà không có nhân viên nào đạt được 10x năng suất đang được nhiều người đề cập.
- Một cá nhân từ Stripe chứng kiến sự gia tăng doanh thu từ 250 triệu USD lên 5 tỷ USD mà không gặp thách thức nào.
- Dự đoán trong năm 2026, các công ty sẽ ngừng trả tiền cho nhiều mô hình AI và có thể chuyển sang mô hình mã nguồn mở để tiết kiệm chi phí.
Engineering Leadership
Best Engineering Leaders Know How To Switch Off
- Hôm nay là Giao thừa, và nhiều người đang có thời gian nghỉ phép có lương.
- Cần tôn trọng Code Freeze nếu có trong thỏa thuận của tổ chức kỹ thuật.
- Không thể nghỉ ngơi nếu còn “dập lửa” với các vấn đề sản xuất.
- Tác giả chia sẻ về trải nghiệm khó khăn khi không thể tắt rời công việc và cách giải quyết điều này.
- Là một lãnh đạo kỹ thuật, việc tắt rời công việc rất quan trọng để làm gương cho đội ngũ.
- Không thể làm mọi thứ một mình và chấp nhận công việc dài hạn có thể dẫn đến kiệt sức.
- Khi không thể tắt rời, lãnh đạo vô tình tạo áp lực lên đội ngũ, làm họ cảm thấy cần phải làm như vậy.
- Lãnh đạo cần đặt ra ví dụ tốt, ví dụ như không kiểm tra tin nhắn ngoài giờ làm việc.
- Tác giả đã bắt đầu ủy thác nhiều hơn và tin tưởng vào đội ngũ của mình.
- Việc không phản hồi tin nhắn trong thời gian nghỉ phép giúp xây dựng đội ngũ hoạt động độc lập.
Strategize Your Career
I designed a system for productive software engineers to minimize interruptions in their team
- Cuối năm, tác giả chúc mọi người một năm 2026 thành công và đầy tập trung.
- Tác giả đang cung cấp giảm giá 25% cho một năm nội dung cao cấp.
- Bài viết này giới thiệu các bài viết độc quyền cho người đăng ký trả phí với các kỹ thuật năng suất dễ áp dụng.
- Tác giả nhấn mạnh rằng kỹ sư phần mềm giỏi không chỉ viết mã mà còn xây dựng quy trình để viết mã.
- Tác giả chia sẻ một ví dụ về việc nhiều kỹ sư cùng làm một nhiệm vụ do thiếu giao tiếp hiệu quả.
- Thiếu quy trình rõ ràng khiến việc sử dụng thời gian không hiệu quả và gây lãng phí tài nguyên.
- Để tạo ra ảnh hưởng lớn hơn, cần xây dựng hệ thống thay vì chỉ tìm kiếm sự công nhận qua “sự hữu ích”.
- Bài viết hứa hẹn cung cấp kỹ thuật đã được chứng minh để khôi phục thời gian làm việc sâu và giảm thiểu sự ồn ào từ các yêu cầu.
Open Source Projects - Latest Discoveries
A clean, private URL shortener you can self-host.
The open-source, self-hosted alternative to Todoist.
Send private push notifications to your iOS devices locally.
Real-time terminal-based intrusion detection for your web servers.
Build a powerful task management system in C
Deploy a production-ready Azure hub-spoke network for learning
Build agents with these ready-to-use ADK samples
Build rigid body physics for multi-core games and VR
Run a GPT-4o level multimodal AI on your phone.
A technical utility for MongoDB research and security testing.
Use cloud browsers with Claude Code instead of local Chrome.
A lightweight tool to mirror and archive websites locally.
Hacker News: Best
🔥 Warren Buffett steps down as Berkshire Hathaway CEO after six decades
🔥 I canceled my book deal
🔥 Stardew Valley developer made a $125k donation to the FOSS C# framework MonoGame
🔥 Efficient method to capture carbon dioxide from the atmosphere
🔥 Tell HN: Happy New Year
💬 Akin’s Laws of Spacecraft Design (2011) [pdf]
🔥 The rise of industrial software
🔥 Show HN: Use Claude Code to Query 600 GB Indexes over Hacker News, ArXiv, etc.
🔥 LLVM AI tool policy: human in the loop
💬 Project ideas to appreciate the art of programming
Top 5 Digital Waiver Tools for Fitness Pros in 2025
Building a YouTube Automation System with Claude AI: From News to Shorts in Minutes
Building an AI-Powered Customer Churn Prediction Pipeline on AWS (Step-by-Step)
The AI Agent Feedback Loop: From Evaluation to Continuous Improvement
Revolutionizing Energy: The Rise of Fusion Startups
I Built a Mental Health SaaS for Entrepreneurs - Here’s the Tech Stack
Debugging “Where to spend my time?” in the job search 🌲
Gemma: Open Models Based on Gemini Research and Technology
Why Learning C Is My First Step Toward Becoming a Game Engine Programmer
My summary of 2025 as an IAM consultant and non-web developer
A New Kind of Parser Method
I Ditched New Year’s Resolutions for AI-Powered Quarterly Reviews