RAG vs Fine-tuning ต่างกันยังไง — ใช้กับธุรกิจไทยควรเลือกอะไร
อธิบาย RAG กับ Fine-tuning แบบไม่ใช้ศัพท์เทคนิคจัด — ใช้กับเคสไหน, ค่าใช้จ่ายเท่าไร, accuracy ต่างกันยังไง, ตัวอย่างการใช้งานจริงในธุรกิจไทย
ทุกครั้งที่คุยเรื่อง AI กับลูกค้า คำถามที่ตามมาคือ “RAG หรือ fine-tuning ดีกว่ากัน” คำตอบคือ “แล้วแต่เคส” — แต่ส่วนใหญ่ของธุรกิจไทย คำตอบที่ถูกคือ RAG
RAG (Retrieval-Augmented Generation) คืออะไร
แนวคิดง่าย ๆ: ค้นข้อมูลจริงก่อน แล้วเอามาให้ LLM ตอบ
[User Question]
→ Search ข้อมูลที่เกี่ยวข้องจาก database
→ ส่ง search result + question ให้ LLM
→ LLM ตอบโดยอ้างจากข้อมูลที่ได้
LLM ไม่ต้อง “จำ” ข้อมูล แค่ “อ่าน” ข้อมูลที่ให้ตอนนั้นแล้วสรุปคำตอบ
ข้อดี
- อัปเดตข้อมูลได้ทันที (เปลี่ยน document → บอทตอบจากเวอร์ชั่นใหม่)
- ไม่ hallucinate (เพราะมี source ให้อ้าง)
- ใช้ LLM ตัวไหนก็ได้ (Claude, GPT, Gemini, open source)
- ไม่ต้อง train เอง
ข้อเสีย
- ต้องมี vector DB + search infrastructure
- คุณภาพคำตอบขึ้นกับคุณภาพ retrieval
- ต้นทุน inference สูงกว่า fine-tune ระยะยาว (ถ้า volume เยอะ)
Fine-tuning คืออะไร
แนวคิด: สอน LLM ด้วยข้อมูลเรา ให้มันจำและตอบในสไตล์ที่ต้องการ
[Training Dataset (input → output pairs)]
→ Train model หลาย epoch
→ Model weights ใหม่ที่ "รู้จัก" pattern นั้น
→ Deploy เป็น API ใช้งาน
ข้อดี
- ตอบในสไตล์ที่ต้องการได้แม่นยำ (เช่น tone ของแบรนด์)
- Inference เร็วและถูกกว่า RAG ระยะยาว
- ไม่ต้อง retrieve ทุกครั้ง
ข้อเสีย
- ทุกครั้งที่ข้อมูลเปลี่ยน → ต้อง retrain
- ค่า training สูง ($100–$5000 ต่อรอบ)
- ต้องมี dataset คุณภาพดี (ขั้นต่ำ 1,000+ pairs)
- เสี่ยง overfitting
ตารางเปรียบเทียบ
| ปัจจัย | RAG | Fine-tuning |
|---|---|---|
| ข้อมูลเปลี่ยนบ่อย | ✅ เหมาะ | ❌ ต้อง retrain |
| ตอบจากเอกสารยาว | ✅ เหมาะ | ⚠️ ลำบาก |
| ตอบในสไตล์เฉพาะ | ⚠️ ต้องเขียน prompt ดี | ✅ เหมาะ |
| Citation/อ้างอิง | ✅ ง่าย | ❌ ยาก |
| ราคา setup | ฿50k–฿300k | ฿100k–฿1M+ |
| ราคา ongoing | ปานกลาง (API calls + vector DB) | ต่ำ (แค่ inference) |
| ความเร็วตอบ | ปานกลาง (2–4 วินาที) | เร็ว (<1 วินาที) |
| Hallucination | ต่ำ | ปานกลาง-สูง |
ตัวอย่างเคสที่ “ควรใช้ RAG”
Chatbot ตอบจากเอกสารบริษัท
ข้อมูลเปลี่ยนทุกเดือน (โปรโมชัน, สเปกสินค้า, นโยบาย) — RAG ชนะขาดลอย
ระบบ Q&A จากเอกสารราชการ
เอกสารยาวเป็นร้อยหน้า, ต้องอ้างอิงได้, ต้องการ source — RAG จำเป็น (ดูสูตรเต็มที่ OCR ภาษาไทย + RAG)
Search engine ภายในบริษัท
หาข้อมูลจาก wiki + Slack + email — RAG เหมาะมาก
ตัวอย่างเคสที่ “ควร Fine-tune”
บอทบริการลูกค้าที่ต้องตอบในสไตล์แบรนด์
เช่น แบรนด์เครื่องสำอางต้องตอบนุ่มนวล ใส่ emoji เฉพาะ — fine-tune ได้สไตล์เป๊ะ
Classify ข้อความเป็นหมวด
จัดประเภท email/ticket เข้าหมวดต่าง ๆ — fine-tune classifier เร็วและถูก
Generate text ตาม template เฉพาะ
สร้างใบเสนอราคา, สรุปประชุม, รายงาน ในรูปแบบเฉพาะของบริษัท
Hybrid: ใช้ทั้งสองอย่าง
ในเคสที่ซับซ้อน เราใช้ทั้งสองอย่างควบคู่:
- Fine-tune model เล็ก ๆ ให้รู้ตอบสไตล์แบรนด์ + จัด format
- RAG retrieve ข้อมูลจริงให้ model อ่าน
ตัวอย่าง: LINE OA chatbot ที่ตอบคำถามเรื่องสินค้า → RAG retrieve สเปกสินค้า + fine-tuned model ตอบในโทนแบรนด์
ต้นทุนจริงในการทำ
RAG project ระดับ SME
- Setup: ฿100,000 – ฿300,000
- Monthly: ฿5,000 – ฿20,000 (API + vector DB + hosting)
Fine-tuning project
- Dataset preparation: ฿50,000 – ฿200,000 (labor)
- Training: $200 – $5,000
- Monthly: ฿3,000 – ฿15,000 (inference + hosting)
ข้อผิดพลาดที่เห็นบ่อย
Fine-tune โดยไม่มี dataset พอ — ลูกค้าหลายคนคิดว่า fine-tune กับข้อมูล 50 ตัวอย่างก็พอ ผลคือ model เสียมากกว่าได้
RAG โดยไม่ทำ chunking ที่ดี — แบ่ง chunk ผิด context ขาด retrieval ไม่เจอ คำตอบจะแย่
ไม่วัด accuracy — สร้างเสร็จไม่มี test set ไม่รู้ดีหรือไม่ดี → ต้อง prep eval dataset อย่างน้อย 100 ตัวอย่าง
เริ่มยังไง
ถ้าคุณกำลังคิดทำ AI ในธุรกิจ — เริ่มจาก RAG ก่อนเสมอ ลงทุนถูก ปรับง่าย และเห็นผลเร็ว ถ้าใช้งานจริงแล้วเจอ pattern ที่ต้องตอบในสไตล์เฉพาะค่อย fine-tune เพิ่ม
ปรึกษาเราได้ที่ /#contact — audit ฟรีว่าโจทย์ของคุณเหมาะกับ RAG, fine-tune หรือ hybrid (ดูเคสจริงใน AI Chatbot บน LINE OA)
ทำ OCR ภาษาไทยให้แม่นจริง — สูตร RAG ที่เราใช้กับเอกสารราชการ
วิธีสร้างระบบ OCR ภาษาไทยที่ accuracy 98%+ บวก RAG ค้นหาเอกสาร — เลือก engine, จัดการ layout ซับซ้อน, vector DB และ pitfall ที่เจอจริง
ทำ AI Chatbot บน LINE OA สำหรับธุรกิจไทย — ต้องเตรียมอะไร และค่าใช้จ่ายจริง
คู่มือทำ AI chatbot บน LINE Official Account ที่ตอบลูกค้าได้จริง — เลือก LLM ยังไง, ราคา API, ค่าระบบ, ค่า maintain รายเดือน
เราทำงานกับลูกค้าใหม่ยังไง — process onboarding ที่ใช้จริง
ขั้นตอนตั้งแต่คุยครั้งแรกถึงส่งมอบงาน — discovery, scope, mockup, build, launch, maintain — ใช้เวลาเท่าไรแต่ละขั้น และเอกสารที่ลูกค้าจะได้รับ