Tulisan

Pemikiran tentang Cloud Computing, DevOps, dan Software Engineering.
Berbagi pelajaran dari membangun sistem yang scalable.

Bikin MCP Client yang Nyambung ke Banyak Server Sekaligus (Python)

Kebanyakan tutorial MCP berhenti di satu client, satu server. Agen beneran butuh banyak. Panduan ini bikin client Python yang nyambung ke dua MCP server paralel, prefix tool-nya biar nggak tabrakan, dan oper ke Claude sebagai tool definition format Anthropic.

Bikin MCP Server Pertamamu di Python: Panduan Hands-On

Model Context Protocol jadi standar baru buat kasih LLM akses ke tools dan data. Panduan ini nuntun kamu bikin MCP server beneran di Python, konekin ke Claude Code, dan ship dalam waktu kurang dari satu jam.

Jalanin Code Reviewer LLM Lokal dengan Ollama dan Continue.dev

Setup praktis buat code reviewer privat yang jalan offline. Tarik model coding di Ollama, sambungin ke VS Code lewat Continue, dan review diff tanpa kode kamu pernah keluar dari mesin.

Self-Host LLM dengan vLLM: Server OpenAI-Compatible Production-Grade

Jalankan LLM open-source di GPU sendiri dan dapatkan API OpenAI-compatible dalam satu perintah. Bahas install, PagedAttention, OpenAI server, performance tuning, sampai deploy production.

Bikin Docker Image Production yang Kecil, Cepat, dan Aman

Enam teknik praktis untuk mengecilkan Docker image hingga 90%, mempercepat deployment, dan memperkecil permukaan serangan. Dengan contoh copy-paste untuk Go, Node.js, dan Python.

Load Testing dengan k6.io: Beginner's Guide

Tutorial praktis menggunakan k6.io untuk load testing. Includes contoh script dan interpretasi results untuk production environment.