Revolusi AI di Tangan Anda: Panduan Lengkap Pasang DeepSeek Secara Tempatan Menggunakan Ollama di Windows 11

Tarikh: 20 Mei 2026

deploy-deepseek-ollama-windows-11-local

Pengenalan: Membawa Kuasa AI Generatif ke Desktop Anda

Dunia kecerdasan buatan (AI) berkembang dengan kelajuan yang menakjubkan, dan model bahasa besar (LLM) seperti DeepSeek semakin menjadi tunjang kepada inovasi digital. Di Malaysia, sama ada anda seorang pembangun, penyelidik, atau pemilik PKS yang ingin memanfaatkan kuasa AI, kemampuan untuk menjalankan model-model ini secara tempatan (locally) menawarkan kelebihan yang signifikan – dari privasi data yang lebih baik hingga kawalan penuh ke atas infrastruktur dan kos yang lebih rendah dalam jangka panjang.

Dalam landskap transformasi digital yang semakin sengit ini, keupayaan untuk menguji, menyesuaikan, dan menyebarkan model AI secara tempatan tanpa bergantung sepenuhnya pada perkhidmatan awan adalah satu kelebihan strategik. Artikel ini akan membimbing anda secara langkah demi langkah tentang cara untuk memasang dan mengendalikan DeepSeek, sebuah model bahasa sumber terbuka yang berkuasa, di komputer Windows 11 anda menggunakan Ollama. Ollama adalah alat yang mudah digunakan dan berkesan yang menyederhanakan proses penyebaran LLM, menjadikan teknologi AI canggih ini lebih mudah diakses oleh semua lapisan pengguna di Malaysia.

Kita akan meneroka mengapa DeepSeek dan Ollama adalah gandingan yang ideal, apakah prasyarat sistem yang diperlukan, dan bagaimana untuk melakukan pemasangan serta mengoptimumkan prestasi model. Bersedialah untuk membuka potensi AI generatif di hujung jari anda!

Mengapa DeepSeek dan Ollama? Gabungan Ideal untuk Pembangunan AI Tempatan

Memilih model AI yang sesuai dan platform penyebaran yang berkesan adalah penting. DeepSeek dan Ollama masing-masing menawarkan kelebihan unik yang menjadikannya pilihan yang sangat baik untuk projek AI tempatan anda.

Memahami DeepSeek: Kuasa LLM Sumber Terbuka

DeepSeek adalah siri model bahasa besar sumber terbuka yang dibangunkan oleh DeepSeek-AI. Ia terkenal dengan prestasinya yang kompetitif berbanding dengan model proprietari lain, terutamanya dalam tugas-tugas yang berkaitan dengan pengaturcaraan dan penjanaan kod (seperti DeepSeek Coder). Dengan versi yang berbeza-beza saiz (dari 1.3B hingga 67B parameter), DeepSeek menyediakan fleksibiliti untuk pelbagai keperluan dan kapasiti perkakasan.

Kelebihan DeepSeek:

Sumber Terbuka: Ini bermakna anda mempunyai kebebasan untuk menggunakan, mengubah suai, dan menyebarkan model tanpa sekatan lesen yang mahal. Ia memupuk inovasi dan kolaborasi dalam komuniti pembangun.
Prestasi Tinggi: DeepSeek telah menunjukkan keupayaan yang mengagumkan dalam ujian penanda aras, terutamanya untuk tugas-tugas pengekodan, menjadikan ia aset berharga untuk jurutera perisian dan saintis data di Malaysia.
Fleksibiliti: Tersedia dalam pelbagai saiz, membolehkan anda memilih model yang paling sesuai dengan sumber komputasi anda, sama ada anda menggunakan kad grafik (GPU) berprestasi tinggi atau perkakasan yang lebih sederhana.

Memahami Ollama: Mempermudahkan Penyebaran LLM

Ollama ialah rangka kerja yang direka untuk memudahkan pemasangan dan penggunaan model bahasa besar di sistem tempatan. Ia mengambil alih kerumitan dalam menguruskan kebergantungan, mengoptimumkan model untuk perkakasan anda, dan menyediakan antara muka yang mudah untuk berinteraksi dengannya.

Kelebihan Ollama:

Pemasangan Mudah: Dengan satu pemasang, anda boleh menyediakan persekitaran untuk menjalankan pelbagai LLM dalam beberapa minit sahaja. Tiada lagi kekeliruan dengan konfigurasi conda atau pip yang kompleks.
Sokongan Pelbagai Model: Ollama menyokong pelbagai LLM popular termasuk Llama 2, Mistral, Gemma, dan sudah tentu, DeepSeek. Ini membolehkan anda bereksperimen dengan model yang berbeza tanpa perlu menukar keseluruhan persediaan.
API Seragam: Ia menyediakan API RESTful yang konsisten, membolehkan pembangun untuk dengan mudah mengintegrasikan model-model ini ke dalam aplikasi mereka sendiri, sama ada untuk membina chatbot pelanggan bagi PKS atau alat analisis data dalaman.
Dioptimumkan untuk Perkakasan: Ollama direka untuk memanfaatkan sepenuhnya perkakasan anda, terutamanya kad grafik NVIDIA (dengan sokongan CUDA), untuk prestasi inferens yang lebih pantas.

Faedah Gabungan DeepSeek dan Ollama untuk Pengguna Malaysia

Menggabungkan DeepSeek dan Ollama membawa beberapa faedah kritikal, terutamanya dalam konteks Malaysia:

Kedaulatan dan Privasi Data: Bagi syarikat korporat dan PKS yang berurusan dengan data sensitif, menjalankan LLM secara tempatan bermakna data anda tidak pernah meninggalkan premis anda. Ini adalah penting untuk pematuhan peraturan dan menjaga kepercayaan pelanggan.
Kawalan Penuh: Anda mempunyai kawalan sepenuhnya ke atas model, parameter, dan persekitaran berjalan, membolehkan penyesuaian yang mendalam untuk keperluan perniagaan khusus.
Kos Efektif: Elakkan kos penggunaan API LLM berasaskan awan yang mungkin meningkat seiring dengan penggunaan. Dengan pemasangan tempatan, kos utama adalah pelaburan awal dalam perkakasan, yang boleh memberi pulangan yang baik dalam jangka masa panjang.
Kelajuan dan Kependaman Rendah: Respons model adalah serta-merta tanpa kelewatan rangkaian, yang penting untuk aplikasi masa nyata seperti sokongan pelanggan atau analisis segera.
Eksperimentasi Bebas: Pembangun dan penyelidik boleh bereksperimen dengan pelbagai model dan parameter tanpa perlu bimbang tentang bil awan yang tidak dijangka. Ini merancakkan inovasi tempatan.

Imej 1: Menyediakan asas teknologi untuk revolusi AI tempatan. Seorang jurutera atau pembangun fokus di hadapan beberapa monitor komputer, menunjukkan usaha dalam bidang teknologi dan pengaturcaraan.

Prasyarat Sistem untuk Pemasangan Ollama dan DeepSeek di Windows 11

Sebelum kita melompat ke proses pemasangan, adalah penting untuk memastikan sistem Windows 11 anda memenuhi keperluan minimum dan optimum untuk menjalankan model bahasa besar dengan lancar. Ini akan menjimatkan masa dan mengelakkan kekecewaan kemudian.

Sistem Operasi

Windows 11 (64-bit): Pastikan anda menggunakan Windows 11 versi terkini untuk keserasian dan ciri-ciri terbaik. Walaupun Ollama mungkin berfungsi pada Windows 10, Windows 11 secara amnya menawarkan pengurusan sumber yang lebih baik dan sokongan teknologi terkini.

Perkakasan (Hardware)

Ini adalah aspek paling kritikal untuk prestasi LLM tempatan. Semakin baik perkakasan anda, semakin cepat dan lancar DeepSeek akan berjalan.

Memori Akses Rawak (RAM):
- Minimum: 8GB RAM. Ini mungkin cukup untuk model DeepSeek yang paling kecil (seperti 1.3B), tetapi akan sangat terhad.
- Disyorkan: 16GB RAM atau lebih. Untuk menjalankan model DeepSeek bersaiz sederhana (seperti 7B atau 8B) dengan selesa, terutamanya jika anda ingin menjalankan aplikasi lain secara serentak.
- Ideal: 32GB RAM atau lebih. Ini membolehkan anda menjalankan model yang lebih besar (16B ke atas) atau beberapa model secara serentak, serta memastikan sistem operasi anda mempunyai ruang bernafas yang mencukupi.
Unit Pemprosesan Pusat (CPU):
- Minimum: Pemproses dwi-teras (dual-core) yang moden.
- Disyorkan: Pemproses empat-teras (quad-core) atau lebih tinggi (contoh: Intel Core i5/i7/i9 generasi ke-8 atau AMD Ryzen 5/7/9) dengan kelajuan jam yang baik. Walaupun kebanyakan beban kerja akan beralih ke GPU, CPU masih memainkan peranan dalam memuatkan model dan pengurusan proses.
Unit Pemprosesan Grafik (GPU) / Kad Grafik:
- Ini adalah komponen perkakasan yang paling penting untuk prestasi LLM. Inferens model bahasa besar adalah operasi pengiraan intensif yang sangat dioptimumkan untuk GPU.
- NVIDIA (CUDA): Sangat disyorkan. Ollama di Windows sangat bergantung pada ekosistem CUDA NVIDIA.
  - Kad Grafik Disyorkan: Siri NVIDIA GeForce RTX (cth: RTX 3050, RTX 3060, RTX 4070, dll.) atau GTX 1660 Super ke atas.
  - VRAM (Video RAM): Ini adalah yang paling penting.
    - Minimum: 6GB VRAM. Boleh menjalankan model DeepSeek 7B dengan kuantisasi yang agresif.
    - Disyorkan: 8GB VRAM atau lebih (cth: RTX 3060 12GB, RTX 4060 Ti 16GB, RTX 3070 8GB). Dengan VRAM 8GB, anda boleh menjalankan model 7B/8B dengan lebih lancar dan model 16B/18B dengan kuantisasi sederhana.
    - Ideal: 12GB VRAM atau lebih (cth: RTX 3060 12GB, RTX 4070 Ti 12GB, RTX 4080 16GB, RTX 4090 24GB). Ini membolehkan anda menjalankan model yang lebih besar (hingga 34B parameter) dengan kuantisasi yang lebih rendah (bermakna ketepatan yang lebih tinggi).
- AMD (ROCm/DirectML): Ollama mempunyai sokongan eksperimen untuk AMD GPU melalui DirectML di Windows. Namun, sokongan ini mungkin kurang matang berbanding CUDA NVIDIA. Jika anda mempunyai AMD GPU moden dengan VRAM yang mencukupi (RX 6000 series ke atas), anda boleh cuba, tetapi prestasi mungkin berbeza.
- Tanpa GPU Dedikasi: Jika anda hanya mempunyai grafik bersepadu (integrated graphics) pada CPU anda (contoh: Intel Iris Xe, AMD Radeon Graphics), anda masih boleh menjalankan model DeepSeek melalui Ollama, tetapi proses inferens akan sepenuhnya bergantung pada CPU. Ini akan menjadi sangat perlahan, mungkin mengambil beberapa saat hingga seminit untuk menjana respons walaupun untuk prompt yang ringkas. Ia tidak disyorkan untuk penggunaan serius.
Storan:
- Jenis: Solid State Drive (SSD) adalah mandatori. Memuatkan model dari HDD akan menjadi sangat perlahan.
- Ruang Kosong: Sekurang-kurangnya 50GB ruang kosong. Model LLM boleh bersaiz antara beberapa gigabyte hingga puluhan gigabyte setiap satu. Jika anda bercadang untuk bereksperimen dengan beberapa model, sediakan 100GB atau lebih.

Imej 2: Komponen perkakasan adalah nadi kepada setiap operasi AI. Pandangan dekat papan litar bercetak yang kompleks dengan pelbagai cip elektronik dan komponen lain, melambangkan teknologi dan perkakasan komputer.

Perisian Lain

Pemandu Kad Grafik (Graphics Drivers): Pastikan pemandu kad grafik NVIDIA atau AMD anda adalah yang terkini. Pemandu yang usang boleh menyebabkan masalah prestasi atau ketidakserasian.
Penyemak Imbas Web (Web Browser): Untuk memuat turun Ollama.
PowerShell atau Command Prompt: Untuk berinteraksi dengan Ollama.

Peringatan Penting: Semak penggunaan VRAM anda secara berkala menggunakan Task Manager (tab Performance > GPU) atau alat seperti nvidia-smi (jika anda mempunyai NVIDIA GPU) untuk memastikan model sesuai dengan kapasiti kad grafik anda.

Langkah-Langkah Pemasangan Ollama di Windows 11

Proses pemasangan Ollama di Windows 11 adalah sangat mudah dan ringkas. Ikuti langkah-langkah di bawah:

1. Muat Turun Pemasang Ollama

Buka penyemak imbas web anda (contoh: Google Chrome, Microsoft Edge, Firefox).
Pergi ke laman web rasmi Ollama: https://ollama.ai/
Di halaman utama, anda akan melihat butang "Download". Klik padanya.
Pilih versi Windows untuk dimuat turun. Ia biasanya akan mengesan sistem operasi anda secara automatik. Pemasang akan bersaiz kira-kira 150-200 MB.

2. Jalankan Pemasang Ollama

Setelah fail .exe selesai dimuat turun, cari fail tersebut di folder "Downloads" anda (atau lokasi lain yang anda pilih).
Klik dua kali pada fail OllamaSetup.exe untuk memulakan proses pemasangan.
Anda mungkin akan diminta oleh Kawalan Akaun Pengguna (User Account Control - UAC) untuk membenarkan aplikasi membuat perubahan pada peranti anda. Klik "Yes".

3. Ikuti Arahan Pemasangan

Pemasang Ollama adalah sangat mudah. Ia biasanya akan menyediakan pilihan untuk memilih lokasi pemasangan. Sebaiknya biarkan lokasi lalai melainkan anda mempunyai sebab tertentu untuk mengubahnya.
Klik "Install" atau "Next" untuk meneruskan.
Pemasang akan menyalin fail yang diperlukan dan menyediakan perkhidmatan Ollama. Ini biasanya hanya mengambil masa beberapa saat hingga seminit.
Setelah pemasangan selesai, anda akan melihat mesej pengesahan. Klik "Finish" atau "Close".

4. Pengesahan Pemasangan dan Status Perkhidmatan

Ollama direka untuk berjalan sebagai perkhidmatan latar belakang sebaik sahaja dipasang. Ini bermakna ia akan bermula secara automatik apabila Windows anda boot.

Semak ikon di System Tray: Anda sepatutnya melihat ikon Ollama (berbentuk kepala anjing laut) di System Tray Windows anda (biasanya di sudut kanan bawah skrin anda, mungkin tersembunyi di sebalik ikon panah atas). Jika anda klik kanan padanya, anda boleh melihat pilihan seperti "Show Logs", "Check for Updates", atau "Quit". Ini menunjukkan Ollama sedang berjalan.
Gunakan Command Prompt/PowerShell:
- Buka Command Prompt atau PowerShell. Anda boleh melakukannya dengan menaip cmd atau powershell dalam kotak carian Windows dan menekah Enter.
- Taip arahan berikut dan tekan Enter:
```
ollama --version
```
- Anda sepatutnya melihat output yang menunjukkan versi Ollama yang terpasang (contoh: ollama version is 0.1.X). Jika anda menerima ralat seperti " 'ollama' is not recognized as an internal or external command...", ini mungkin bermakna Ollama tidak dipasang dengan betul atau tidak berada dalam PATH sistem anda (jarang berlaku dengan pemasang rasmi). Cuba mulakan semula komputer anda.
Uji dengan Model Ringkas:
- Untuk memastikan semuanya berfungsi dengan baik dan Ollama boleh memuat turun dan menjalankan model, anda boleh cuba memuat turun dan menjalankan model yang kecil seperti Llama 2:
```
ollama run llama2
```
- Ollama akan mula memuat turun model Llama 2 (jika belum ada). Ini mungkin mengambil masa beberapa minit bergantung pada kelajuan internet anda.
- Setelah selesai dimuat turun, Llama 2 akan bermula dan anda akan melihat prompt interaktif (contoh: >>>). Anda boleh taip soalan dan tekan Enter untuk mendapatkan respons. Jika ia berfungsi, tahniah! Anda telah berjaya memasang Ollama.
- Untuk keluar dari sesi interaktif, taip /bye dan tekan Enter, atau tekan Ctrl + C.

Dengan Ollama berjaya dipasang dan berfungsi, kini anda bersedia untuk membawa model DeepSeek ke dalam sistem anda.

Mencari dan Memuat Turun Model DeepSeek Menggunakan Ollama

Ollama menyediakan antara muka yang mudah untuk mencari dan memuat turun pelbagai model LLM, termasuk model dari siri DeepSeek.

1. Mengenal Pasti Model DeepSeek yang Sesuai

DeepSeek datang dalam beberapa variasi, yang paling popular untuk kegunaan umum dan pengekodan adalah:

deepseek-coder: Model yang dioptimumkan secara khusus untuk tugas pengekodan, penjanaan kod, dan pemahaman kod. Ia boleh didapati dalam pelbagai saiz (e.g., 6.7B, 33B). Ini adalah pilihan terbaik jika fokus anda adalah pembangunan perisian.
deepseek-llm (atau deepseek-chat): Model tujuan umum yang direka untuk perbualan, penjanaan teks, ringkasan, dan tugas bahasa umum yang lain. Juga terdapat dalam pelbagai saiz (e.g., 7B, 67B).

Anda boleh menyemak senarai model yang tersedia dan variasi saiz di laman web Ollama (https://ollama.ai/library). Cari "deepseek" untuk melihat semua model DeepSeek yang dihoskan oleh komuniti Ollama.

Faktor Pemilihan Model:

VRAM GPU Anda: Pilih model yang sesuai dengan kapasiti VRAM kad grafik anda. Jika anda mempunyai 8GB VRAM, model 7B/8B adalah pilihan yang selamat. Jika anda mempunyai 12GB atau lebih, anda boleh mencuba model 33B/34B dengan kuantisasi yang lebih tinggi.
Keperluan Tugas: Jika anda seorang pembangun di Cyberjaya atau Tech Valley yang memerlukan pembantu pengekodan AI, deepseek-coder adalah pilihan yang jelas. Jika anda memerlukan model untuk penjanaan teks kreatif atau chatbot, deepseek-llm mungkin lebih sesuai.

2. Memuat Turun Model DeepSeek

Setelah anda memilih model DeepSeek yang ingin anda gunakan, proses muat turun adalah sangat mudah melalui Command Prompt atau PowerShell:

Buka Command Prompt atau PowerShell.
Gunakan arahan ollama pull diikuti dengan nama model. Contohnya, jika anda ingin memuat turun DeepSeek Coder 6.7B (sering disingkat sebagai deepseek-coder dalam perpustakaan Ollama), anda akan menaip:
```
ollama pull deepseek-coder
```
Jika anda ingin memuat turun DeepSeek LLM 7B, anda boleh menaip:
```
ollama pull deepseek-llm
```
Ollama akan mula memuat turun semua fail model yang diperlukan. Saiz model boleh berkisar dari beberapa gigabyte hingga puluhan gigabyte, jadi proses ini mungkin mengambil masa yang ketara bergantung pada kelajuan internet anda.

Anda akan melihat bar kemajuan dalam konsol menunjukkan status muat turun.

pulling manifest
pulling 8dd8014dd5cd... 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████

3. Memuatkan DeepSeek untuk Penggunaan Interaktif

Setelah model DeepSeek selesai dimuat turun, anda boleh memulakannya dalam sesi interaktif menggunakan arahan ollama run:

Buka Command Prompt atau PowerShell (jika belum dibuka).
Taip arahan berikut, menggantikan deepseek-coder dengan nama model DeepSeek yang anda muat turun:
```
ollama run deepseek-coder
```
Ollama akan memuatkan model ke dalam memori (kebanyakannya ke VRAM GPU anda jika tersedia dan mencukupi). Ini mungkin mengambil masa beberapa saat.
Setelah model dimuatkan, anda akan melihat prompt interaktif (contoh: >>>). Kini anda boleh mula berinteraksi dengan DeepSeek secara langsung!

Contoh Penggunaan dan Prompt

Mari cuba beberapa prompt yang relevan:

Untuk DeepSeek Coder:

>>> Tuliskan fungsi Python untuk mengira nombor Fibonacci secara rekursif.

Model sepatutnya menjana kod Python yang serupa dengan ini:

def fibonacci_recursive(n):
    if n <= 0:
        return 0
    elif n == 1:
        return 1
    else:
        return fibonacci_recursive(n-1) + fibonacci_recursive(n-2)

# Contoh penggunaan:
# print(fibonacci_recursive(10))

Untuk DeepSeek LLM/Chat:

>>> Terangkan konsep transformasi digital dalam konteks PKS di Malaysia.

Model boleh menjana respons seperti:

Transformasi digital untuk PKS di Malaysia melibatkan integrasi teknologi digital ke dalam semua aspek perniagaan mereka untuk secara asas mengubah cara mereka beroperasi dan menyampaikan nilai kepada pelanggan. Ini bukan sekadar tentang menggunakan perisian baharu, tetapi perubahan budaya yang memerlukan organisasi untuk sentiasa mencabar status quo, bereksperimen, dan menyesuaikan diri dengan perubahan pasaran.

Bagi PKS di Malaysia, transformasi ini boleh merangkumi:
1.  **Pemasaran Digital:** Beralih daripada iklan tradisional kepada platform media sosial, SEO, dan pemasaran kandungan untuk mencapai pasaran yang lebih luas.
2.  **Operasi Perniagaan:** Mengautomasikan proses manual seperti perakaunan, pengurusan inventori, dan logistik menggunakan sistem berasaskan awan atau AI.
3.  **Pengalaman Pelanggan:** Menggunakan chatbot AI untuk sokongan pelanggan, sistem CRM untuk menguruskan hubungan pelanggan, dan platform e-dagang untuk memudahkan pembelian.
4.  **Analisis Data:** Mengumpul dan menganalisis data perniagaan untuk mendapatkan wawasan tentang tingkah laku pelanggan, trend pasaran, dan prestasi operasi.

Faedahnya termasuk peningkatan kecekapan, pengurangan kos operasi, capaian pasaran yang lebih luas, pengalaman pelanggan yang lebih baik, dan daya saing yang dipertingkatkan di pasaran tempatan dan global. Ia penting bagi PKS Malaysia untuk kekal relevan dalam ekonomi digital.

Untuk keluar dari sesi interaktif, taip /bye dan tekan Enter, atau tekan Ctrl + C.

Menggunakan DeepSeek Secara Tempatan Melalui API Ollama (Untuk Pembangun)

Selain daripada sesi interaktif, keindahan Ollama terletak pada API RESTful-nya yang membolehkan anda mengintegrasikan DeepSeek (dan LLM lain) ke dalam aplikasi, skrip, atau sistem yang lebih besar. Ini adalah penting untuk pembangun di Malaysia yang ingin membina penyelesaian AI tersuai.

1. Memastikan Perkhidmatan Ollama Berjalan

API Ollama berjalan sebagai sebahagian daripada perkhidmatan Ollama. Pastikan ikon Ollama hadir di System Tray anda. Jika tidak, anda mungkin perlu memulakan perkhidmatan secara manual melalui pengurus perkhidmatan Windows atau dengan menjalankan ollama serve dalam Command Prompt. Walau bagaimanapun, secara lalai, ia akan bermula secara automatik selepas pemasangan.

API ini biasanya boleh diakses pada http://localhost:11434.

2. Berinteraksi dengan API Menggunakan cURL

cURL adalah alat baris arahan yang sangat berguna untuk membuat permintaan HTTP. Anda boleh menggunakannya dalam Command Prompt atau PowerShell untuk menguji API Ollama.

Contoh Permintaan Generasi Teks (Streamed Output):

curl http://localhost:11434/api/generate -d "{
  \"model\": \"deepseek-coder\",
  \"prompt\": \"Tuliskan templat e-mel untuk memohon pekerjaan jurutera perisian. Pastikan ia profesional dan ringkas.\",
  \"stream\": true
}"

Dalam contoh di atas:

model: Gantikan dengan nama model DeepSeek yang anda muat turun (deepseek-coder atau deepseek-llm).
prompt: Mesej input anda kepada model.
stream: true: Ini akan membolehkan model menjana respons secara beransur-ansur, seperti yang anda lihat dalam antara muka interaktif. Jika anda menetapkannya kepada false, anda akan menerima respons penuh setelah ia selesai dijana.

Output akan menjadi siri objek JSON, dengan setiap objek mewakili sebahagian daripada respons yang dijana.

3. Berinteraksi dengan API Menggunakan Python

Untuk integrasi yang lebih mantap, Python adalah pilihan yang sangat baik. Anda perlu memasang pustaka requests jika anda belum melakukannya:

pip install requests

Kemudian, anda boleh menggunakan skrip Python seperti ini:

import requests
import json

def generate_text_ollama(prompt, model_name="deepseek-coder", stream=False):
    url = "http://localhost:11434/api/generate"
    headers = {"Content-Type": "application/json"}
    data = {
        "model": model_name,
        "prompt": prompt,
        "stream": stream
    }

    try:
        response = requests.post(url, headers=headers, data=json.dumps(data), stream=True)
        response.raise_for_status() # Raise an HTTPError for bad responses (4xx or 5xx)

        if stream:
            full_response = ""
            for line in response.iter_lines():
                if line:
                    decoded_line = line.decode('utf-8')
                    try:
                        json_data = json.loads(decoded_line)
                        if "response" in json_data:
                            print(json_data["response"], end='', flush=True) # Cetak respons secara langsung
                            full_response += json_data["response"]
                        if json_data.get("done"):
                            break
                    except json.JSONDecodeError:
                        print(f"Error decoding JSON: {decoded_line}")
                        continue
            print("\n--- Tamat Penjanaan ---")
            return full_response
        else:
            # For non-streaming, get the full response
            json_response = response.json()
            if "response" in json_response:
                return json_response["response"]
            else:
                return "No response field found in the JSON."

    except requests.exceptions.RequestException as e:
        print(f"Error connecting to Ollama: {e}")
        return None
    except Exception as e:
        print(f"An unexpected error occurred: {e}")
        return None

# Contoh penggunaan:
prompt_code = "Tuliskan fungsi Python untuk mengesahkan alamat e-mel."
print("Menjana kod...")
response_code = generate_text_ollama(prompt_code, model_name="deepseek-coder", stream=True)
# print(f"\nRespons kod: {response_code}") # Jika anda mahu respons penuh setelah stream tamat

print("\n--- Contoh lain ---")
prompt_chat = "Apa itu inflasi dan bagaimana ia mempengaruhi rakyat Malaysia?"
print("Menjana jawapan chat...")
response_chat = generate_text_ollama(prompt_chat, model_name="deepseek-llm", stream=True)
# print(f"\nRespons chat: {response_chat}")

Dengan API Ollama, anda boleh membina aplikasi web, perkhidmatan mikro, atau skrip automasi yang memanfaatkan kuasa DeepSeek untuk pelbagai tugas perniagaan atau penyelidikan di Malaysia.

Mengoptimumkan Prestasi dan Mengatasi Masalah Biasa

Walaupun Ollama memudahkan banyak perkara, menguruskan LLM secara tempatan boleh menghadapi beberapa cabaran. Berikut adalah tips untuk mengoptimumkan prestasi dan mengatasi masalah yang biasa berlaku.

1. Pastikan Penggunaan GPU Diaktifkan

Periksa Task Manager: Buka Task Manager (Ctrl+Shift+Esc), pergi ke tab "Performance", dan pilih GPU anda. Apabila DeepSeek sedang berjalan, anda sepatutnya melihat penggunaan GPU (terutamanya "3D" atau "Compute") dan VRAM yang ketara. Jika penggunaan CPU tinggi dan GPU rendah, mungkin Ollama tidak menggunakan GPU anda dengan berkesan.
Pemandu (Driver) Terkini: Pastikan pemandu kad grafik NVIDIA anda adalah yang terkini. Pemandu lama boleh menyebabkan isu keserasian atau prestasi.
Ruang VRAM: Pastikan anda tidak memuatkan model yang terlalu besar untuk VRAM GPU anda. Jika VRAM penuh, Ollama mungkin akan beralih kepada RAM sistem atau CPU, menyebabkan kelembapan yang ketara.

2. Memilih Model yang Sesuai dengan Perkakasan Anda

Kuantisasi (Quantization): Kebanyakan model Ollama tersedia dalam versi yang telah dikuantisasi (contoh: Q4_K_M, Q5_K_M). Kuantisasi mengurangkan saiz model dan penggunaan VRAM dengan mengurangkan ketepatan berat model, walaupun dengan sedikit kesan terhadap ketepatan. Pilih versi yang lebih kecil jika VRAM anda terhad.
Saiz Model: Jika anda mempunyai 8GB VRAM, cuba kekal pada model 7B/8B. Untuk 12GB+, anda boleh pertimbangkan model 13B/33B yang dikuantisasi.

3. Mengatasi Isu Memori (RAM/VRAM)

Model Tidak Dapat Dimuatkan: Jika anda mendapat ralat seperti "not enough memory" atau "out of memory" apabila cuba memuatkan model, ini bermakna anda tidak mempunyai VRAM atau RAM sistem yang mencukupi. Cuba:
- Tutup aplikasi lain yang menggunakan VRAM atau RAM (permainan, perisian penyuntingan video/grafik).
- Cuba muat turun versi model yang lebih kecil atau yang lebih dikuantisasi.
- Melabur dalam naik taraf kad grafik atau RAM.
Respons Sangat Perlahan: Jika DeepSeek mengambil masa yang sangat lama untuk menjana respons, ia mungkin disebabkan oleh salah satu daripada sebab berikut:
- Tidak menggunakan GPU: Semak Task Manager.
- VRAM tidak mencukupi: Model terpaksa menggunakan RAM sistem yang lebih perlahan.
- CPU-only inferencing: Jika anda tidak mempunyai GPU yang kuat.
- Prompt yang terlalu panjang: Prompt yang sangat panjang memerlukan lebih banyak pengiraan.

4. Isu Rangkaian (Untuk Muat Turun Model)

Muat Turun Gagal: Pastikan sambungan internet anda stabil. Cuba sekali lagi jika muat turun terganggu.
Konfigurasi Proksi: Jika anda berada di dalam rangkaian korporat yang memerlukan proksi, anda mungkin perlu mengkonfigurasi tetapan proksi untuk Ollama. Rujuk dokumentasi Ollama untuk arahan khusus.

5. Memantau Penggunaan Sumber

Gunakan Task Manager untuk memantau penggunaan CPU, RAM, dan GPU anda. Ini akan membantu anda memahami di mana kesesakan berlaku dan menyesuaikan penggunaan anda.
Untuk NVIDIA GPU, anda boleh menggunakan nvidia-smi dalam Command Prompt untuk mendapatkan maklumat terperinci tentang penggunaan GPU dan VRAM.

6. Kemas Kini Ollama

Ollama sentiasa dikemas kini dengan ciri baharu, penambahbaikan prestasi, dan pembetulan pepijat. Secara berkala, semak laman web Ollama atau gunakan ollama pull ollama untuk mengemas kini perisian Ollama itu sendiri.

7. Dapatkan Bantuan Komuniti

Jika anda menghadapi masalah yang berterusan, komuniti Ollama adalah sumber yang sangat baik. Anda boleh mencari forum atau Discord server mereka untuk mendapatkan bantuan daripada pengguna lain atau pembangun.

Dengan sedikit penyesuaian dan pemantauan, anda boleh memastikan DeepSeek berjalan secara optimum di persekitaran Windows 11 anda.

Implikasi dan Peluang di Malaysia

Penyebaran model AI seperti DeepSeek secara tempatan menggunakan Ollama di Windows 11 membuka pelbagai peluang dan mempunyai implikasi penting untuk individu dan organisasi di Malaysia.

1. Untuk Perusahaan Kecil dan Sederhana (PKS)

Transformasi Digital Berpatutan: PKS sering berdepan dengan kekangan bajet. Dengan menjalankan LLM secara tempatan, mereka dapat menguji dan mengintegrasikan AI ke dalam operasi mereka tanpa kos langganan awan yang tinggi. Ini membolehkan mereka bersaing dengan syarikat yang lebih besar.
Privasi Data Pelanggan: Banyak PKS mengendalikan data pelanggan yang sensitif. Penyebaran tempatan memastikan data ini kekal dalam kawalan mereka, mematuhi peraturan privasi tempatan dan antarabangsa, serta membina kepercayaan pelanggan.
Automasi Proses Dalaman: DeepSeek Coder boleh membantu PKS dalam membangunkan skrip automasi tersuai untuk tugas berulang, seperti pengurusan inventori, penyediaan laporan, atau sokongan pelanggan asas.
Pembangunan Kandungan & Pemasaran: Membantu dalam penjanaan draf kandungan untuk blog, media sosial, e-mel pemasaran, atau terjemahan untuk mencapai pasaran yang lebih luas tanpa mendedahkan maklumat sensitif syarikat.

2. Untuk Pembangun dan Penyelidik

Pembangunan Prototaip Cepat: Pembangun di Malaysia kini boleh membina dan menguji aplikasi berasaskan LLM dengan cepat dan berulang kali di komputer mereka sendiri, tanpa perlu risau tentang penggunaan API atau kos awan.
Eksperimentasi Bebas: Penyelidik di universiti atau pusat R&D boleh meneroka pelbagai model, kaedah penalaan halus (fine-tuning), dan aplikasi LLM tanpa sekatan, memupuk inovasi tempatan.
Ketersediaan Sumber Komputasi: Bagi mereka yang mempunyai perkakasan yang sesuai, ini menyediakan persekitaran yang setanding dengan persekitaran awan yang mahal, membolehkan akses kepada teknologi AI terkini.

3. Dalam Sektor Pendidikan

Akses Kepada Teknologi AI: Pelajar dan pensyarah di institusi pendidikan Malaysia boleh mendapatkan pengalaman langsung dengan model AI canggih, meningkatkan kemahiran mereka dalam bidang yang sangat diminati ini.
Projek Pendidikan: Membolehkan projek praktikal dalam AI, sains data, dan pembangunan perisian, di mana pelajar boleh membina aplikasi AI mereka sendiri dari bawah.

4. Isu Kedaulatan Data dan Keselamatan

Kawalan Tempatan: Dalam era kebimbangan kedaulatan data dan keselamatan siber, keupayaan untuk mengendalikan model AI sepenuhnya di bawah kawalan organisasi sendiri adalah satu kelebihan strategik. Ini adalah penting untuk sektor-sektor seperti kerajaan, kewangan, dan penjagaan kesihatan di Malaysia.
Mengurangkan Risiko Pendedahan Data: Mengelakkan penghantaran data sensitif kepada perkhidmatan pihak ketiga atau ke luar sempadan negara.

5. Cabaran yang Perlu Diatasi

Walaupun terdapat banyak peluang, beberapa cabaran perlu ditangani:

Kos Perkakasan Awal: Pelaburan awal dalam kad grafik berprestasi tinggi boleh menjadi penghalang bagi sesetengah PKS atau individu.
Jurang Kemahiran: Walaupun Ollama memudahkan pemasangan, pemahaman asas tentang cara LLM berfungsi dan cara mengoptimumkannya masih diperlukan.
Penyelenggaraan dan Kemas Kini: Pengurusan model tempatan memerlukan penyelenggaraan dan kemas kini berkala.

Secara keseluruhannya, keupayaan untuk menyebarkan DeepSeek secara tempatan menggunakan Ollama adalah satu langkah besar ke hadapan dalam mendemokrasikan akses kepada AI generatif. Ini membolehkan rakyat Malaysia dan perniagaan tempatan untuk mengambil bahagian secara aktif dalam revolusi AI, memacu inovasi dan meningkatkan daya saing dalam pasaran global.

Kesimpulan: Era AI Lokal Bermula di Malaysia

Pemasangan DeepSeek secara tempatan menggunakan Ollama di Windows 11 bukan sahaja menunjukkan kemajuan teknologi yang luar biasa, tetapi juga membuka pintu kepada potensi yang tidak terhingga untuk pelbagai sektor di Malaysia. Dari PKS yang ingin meningkatkan kecekapan dan daya saing mereka dengan transformasi digital, kepada pembangun dan penyelidik yang ingin meneroka sempadan baharu dalam bidang AI, penyebaran LLM tempatan menawarkan kelebihan yang tidak dapat ditandingi.

Kawalan penuh ke atas data, privasi yang dipertingkatkan, kelajuan inferens yang lebih pantas, dan kos yang lebih efektif dalam jangka panjang adalah antara faedah utama pendekatan ini. Dengan alat seperti Ollama yang menyederhanakan proses penyebaran, kuasa model bahasa besar yang canggih seperti DeepSeek kini berada dalam jangkauan yang lebih luas, tidak lagi terhad kepada syarikat-syarikat besar dengan infrastruktur awan yang mahal.

Kami menggalakkan setiap individu dan organisasi di Malaysia, terutamanya mereka yang beroperasi di bidang teknologi, pendidikan, dan perniagaan, untuk mengambil langkah ini. Mulakan eksperimen dengan DeepSeek dan Ollama. Gunakan platform Windows 11 anda untuk meneroka bagaimana AI generatif boleh menyelesaikan masalah, memperkasakan kreativiti, dan memacu inovasi dalam persekitaran tempatan anda. Masa depan AI yang lebih inklusif dan berdaulat data bermula sekarang, di desktop anda sendiri. Semoga panduan ini membantu anda dalam perjalanan AI anda!