Nara AI · นารา เอไอ · กำลังพัฒนา

LLM ภาษาไทย
ที่เปิดเป็นโอเพ่นซอร์ส

โมเดลพื้นฐานตั้งต้นบน Gemma 4 12B พร้อมส่วนขยาย LoRA หลายชั้น ฝึกบนคลังภาษาไทย ~144M token รักษาความเข้าใจ 3 ภาษา (ไทย-อังกฤษ-จีน) ใช้ Apache 2.0 เชิงพาณิชย์ได้

โมเดลพื้นฐานกำลังฝึก น้ำหนักยังไม่เผยแพร่ ดูสถานะได้ที่ GitHub Discussions

Quick Start

เริ่มต้นใช้งาน

สามบรรทัดก็โหลดโมเดล — รองรับทั้ง Hugging Face transformers และ MLX บน Mac

Python (transformers) Python (MLX)
# pip install transformers torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "naralab/nara-ai-12b"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

prompt = "อธิบายหลักการทำงานของ LoRA ในโมเดลภาษาไทย"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_length=512)
print(tokenizer.decode(outputs[0]))
⚡ น้ำหนักโมเดลยังไม่เผยแพร่ — โค้ดด้านบนเป็นการแสดง API ดีไซน์ ติดตามความคืบหน้าได้ที่ GitHub

Capabilities

ความสามารถหลัก

6 เหตุผลที่ Nara AI แตกต่างจาก LLM ทั่วไปในท้องตลาด

เข้าใจภาษาไทยเชิงลึก

Deep Thai Understanding

โมเดลนี้ถูกฝึกต่อ (CPT) บนคลังข้อความภาษาไทยคุณภาพสูง ~144M token เข้าใจทั้งภาษาทางการ ภาษากันเอง คำแสลง และสำเนียงถิ่น ไม่ใช่แค่แปลจากภาษาอังกฤษ

LoRA หลายชั้นเสียบเปลี่ยนได้

Layered LoRA

โมเดลพื้นฐาน 12B ตัวเดียว แต่คุณเปลี่ยนชุดความสามารถได้โดยการเสียบ LoRA ที่ต่างกัน — ต้องการความเข้าใจภาษาไทย ต้องการทำตามคำสั่ง หรือทำงานเฉพาะด้าน เลือกได้ตามงาน

สามภาษาในโมเดลเดียว

Trilingual

เข้าใจไทย อังกฤษ จีน พร้อมกัน ภาษาหนึ่งไม่กลืนอีกภาษา รองรับ code-switching — การผสมภาษาในประโยคเดียว

รันบนเครื่องคุณเองได้

Runs Locally

รองรับทั้งฝั่ง cloud (Hugging Face transformers) และบนเครื่อง Mac (MLX) ด้วย quantization Q4 ใช้ GPU แค่ 16GB — ข้อมูลคุณไม่ออกไปไหน

เปิดกว้าง ใช้เชิงพาณิชย์ได้

Commercial-Ready

Apache 2.0 — ดาวน์โหลด ใช้ แก้ไข และต่อยอดได้โดยไม่มีค่าใช้จ่ายหรือข้อผูกมัด ไม่ต้องขออนุญาต

พัฒนาแบบเปิด

Open Development

ทุกขั้นตอนเปิดเผยบน GitHub Discussions — สถาปัตยกรรม ข้อมูลที่ใช้ฝึก benchmark และความคืบหน้า คุณตรวจสอบและมีส่วนร่วมได้

Architecture

สถาปัตยกรรม

โมเดลพื้นฐานตัวเดียว + ส่วนขยาย LoRA หลายชั้น — เลือกความสามารถได้ตามงาน

ดูรายละเอียด →
โมเดลพื้นฐาน กำลังฝึก
Nara AI 12B ตั้งต้นบน Gemma 4 12B
  • Context 32K
  • GPU 16GB · Mac (MLX) · CPU
  • Apache 2.0
  • ไทย · อังกฤษ · จีน

ส่วนขยาย LoRA (เสียบเปลี่ยนได้)

CPT กำลังฝึก
Continuous Pre-Training

ฝึกต่อบนคลังภาษาไทย ~144M token เพื่อให้เข้าใจภาษาไทยเชิงลึก

SFT กำลังฝึก
Supervised Fine-Tuning

ปรับให้ตอบตามคำสั่ง (instruction following) สนทนา สรุป แปล

Agent วางแผน
Agent Tuning

ฝึกให้ใช้เครื่องมือและทำตามขั้นตอน (tool-use, multi-step workflows)

Domain วางแผน
Domain LoRA

ส่วนขยายเฉพาะโดเมน — กฎหมาย การแพทย์ การเงิน และอื่นๆ

Benchmarks

ผลการทดสอบจริง

คะแนนที่วัดได้จริงจากส่วนขยายภาษาไทย — เน้นความเข้าใจอ่านภาษาไทย

ดู benchmark ทั้งหมด →
Belebele Thai
วัดความเข้าใจภาษาไทย — การอ่านบทความและตอบคำถาม
0.635
สูงกว่า Typhoon (0.390)
MMLU
วัดความรู้ทั่วไประดับมหาวิทยาลัย (ภาษาอังกฤษ)
0.680
คลอบคลุม 57 วิชา
CEval
วัดความรู้ทั่วไปบริบทจีน 52 วิชา
0.762
ความรู้บริบทจีน

* คะแนนวัดระหว่างการพัฒนา · น้ำหนักยังไม่เผยแพร่สาธารณะ · ดู methodology ที่หน้า benchmark

Use Cases

นำไปใช้อะไรได้บ้าง

Nara AI ไม่ได้เป็นแค่ chatbot — มันคือ backbone สำหรับงานภาษาไทยทุกรูปแบบ

RAG / Search

นำ Nara AI ไปใช้ในระบบค้นคืนเอกสาร (RAG) — ฝัง embeddings และตอบคำถามจากคลังเอกสารภาษาไทยของคุณ

Tech stack LLM + Embeddings + Vector DB

Chatbot / Assistant

สร้างแชทบอทภาษาไทยที่เข้าใจบริบท ใช้ LoRA sft เพื่อให้ตอบตามคำสั่งและสนทนาอย่างเป็นธรรมชาติ

Tech stack Base + SFT LoRA

Document Summarization

สรุปเอกสารภาษาไทยยาวๆ — รายงาน บทความ หนังสือราชการ — ด้วย context window 32K tokens

Tech stack CPT LoRA + 32K Context

Content Generation

สร้างเนื้อหาภาษาไทย — บทความ สคริปต์ โฆษณา — โดยอิงตามแนวทางการเขียนของแบรนด์คุณ

Tech stack Base + SFT + Fine-tune

Code Assistant

ใช้เป็นผู้ช่วยเขียนโค้ดที่เข้าใจภาษาไทย — อธิบายโค้ดเป็นไทย เขียน docstring ภาษาไทย หรือแปลง requirement เป็นโค้ด

Tech stack Agent LoRA (coming)

Thai NLP Pipeline

ใช้เป็น backbone สำหรับงาน NLP ภาษาไทย — NER, sentiment, classification, translation — ผ่าน fine-tuning เฉพาะงาน

Tech stack Base + Domain LoRA

FAQ

คำถามที่พบบ่อย

Nara AI ใช้ฟรีไหม?
ใช้ฟรีเต็มรูปแบบ โมเดลเป็น Apache 2.0 — ดาวน์โหลด ใช้เชิงพาณิชย์ แก้ไข และต่อยอดได้โดยไม่ต้องจ่าย
รันบนเครื่องไม่มี GPU ได้ไหม?
ได้ แต่ช้ากว่า แนะนำ quantization Q4 เพื่อลดภาระ ส่วนโมเดล 12B ควรมี GPU 16GB หรือรันบน Mac ผ่าน MLX
ภาษาไทยเก่งแค่ไหนเทียบกับ GPT?
tokenizer และชุดฝึกออกแบบมาเพื่อภาษาไทยโดยเฉพาะ ในงานภาษาไทยลึกซึ้งเทียบได้กับโมเดลใหญ่ และเหนือกว่าเรื่องความเป็นส่วนตัวเพราะรันบนเครื่องคุณ
ข้อมูลของฉันจะหลุดออกไปไหม?
ไม่ เมื่อรัน self-hosted ข้อมูลอยู่ในเครื่องคุณทั้งหมด ไม่มี telemetry ไม่มี phone home
น้ำหนักโมเดลเมื่อไหร่จะปล่อย?
โมเดลกำลังฝึก — เราจะประกาศเมื่อพร้อม ติดตามความคืบหน้าได้ที่ GitHub

สนใจ Nara AI?

ลงทะเบียนรับข่าวสาร ความคืบหน้า และประกาศเมื่อน้ำหนักโมเดลพร้อมปล่อย

หรือส่งอีเมลมาที่ hello@naralab.org