Cách cài đặt và sử dụng DeepSeek-R1 cục bộ trên máy tính của bạn, cho dù bạn sử dụng Ubuntu hay bất kỳ hệ thống nào khác

  • DeepSeek-R1 là một mô hình nguồn mở có khả năng suy luận nâng cao.
  • Ollama đơn giản hóa việc cài đặt và quản lý các mô hình AI cục bộ.
  • ChatBoxAI cung cấp giao diện đồ họa để tương tác với các mô hình như DeepSeek.
  • Mô hình này có thể dễ dàng tích hợp vào các dự án phát triển bằng Python.

DeepSeek-R1 trên Ubuntu

Trí tuệ nhân tạo tiếp tục biến đổi thế giới của chúng ta và các tùy chọn để làm việc với các mô hình ngôn ngữ tiên tiến đang phát triển vượt bậc. Tuy nhiên, không phải ai cũng có nhu cầu kết nối với dịch vụ đám mây hoặc dựa vào bên thứ ba để khám phá những công nghệ này. Một sự thay thế thú vị và dễ tiếp cận là DeepSeek-R1, một mô hình AI cho phép người dùng chạy cục bộ trên các máy tính khiêm tốn. Trong bài viết này, tôi sẽ giải thích cách cài đặt DeepSeek và tận dụng tối đa khả năng của nó.

DeepSeek-R1 là một mô hình AI nguồn mở nổi bật về tính hiệu quả và khả năng suy luận tiên tiến. Bằng cách chạy cục bộ, bạn không chỉ tiết kiệm chi phí định kỳ mà còn bảo vệ quyền riêng tư của mình và có được sự linh hoạt để tích hợp nó vào các dự án tùy chỉnh. Mặc dù một số kiểu máy yêu cầu phần cứng mạnh mẽ, DeepSeek-R1 cung cấp các phiên bản được điều chỉnh cho các tài nguyên khác nhau, từ máy tính cơ bản đến máy trạm nâng cao.

DeepSeek là gì và tại sao lại sử dụng nó cục bộ?

DeepSeek-R1 là một mô hình ngôn ngữ nâng cao được thiết kế cho các nhiệm vụ phức tạp như suy luận logic, giải các bài toán và tạo mã. Ưu điểm chính của nó là mã nguồn mở, có nghĩa là bạn có thể cài đặt và chạy nó trên máy tính của mình mà không phụ thuộc vào máy chủ bên ngoài.

Một số tính năng đáng chú ý của nó bao gồm:

  • Tính linh hoạt: Bạn có thể điều chỉnh mô hình theo nhu cầu của mình, từ phiên bản nhẹ đến cấu hình nâng cao.
  • Bảo mật: Mọi quá trình xử lý đều được thực hiện cục bộ, tránh lo ngại về việc lộ dữ liệu nhạy cảm. Đây có lẽ là điểm quan trọng nhất vì nhiều người lo ngại về những gì các công ty có thể làm với dữ liệu của chúng tôi.
  • Tiết kiệm: Bạn sẽ không phải bỏ tiền ra đăng ký hoặc dịch vụ đám mây, khiến đây trở thành một lựa chọn hợp lý cho các nhà phát triển và doanh nghiệp.

Yêu cầu cài đặt

Trước khi bắt đầu cài đặt, hãy đảm bảo bạn tuân thủ những điều sau yêu cầu:

  • Một máy tính có hệ điều hành Linux, macOS hoặc Windows (có hỗ trợ WSL2 trong trường hợp sau).
  • Tối thiểu GB RAM 8, mặc dù ít nhất nó được khuyến khích 16 GB cho hiệu suất tối ưu.
  • Truy cập Internet để tải xuống các mô hình ban đầu.
  • Kiến thức cơ bản về terminal hoặc dòng lệnh.

Bên cạnh đó, bạn sẽ cần cài đặt một công cụ có tên Ollama, quản lý và chạy các mô hình DeepSeek cục bộ.

Cài đặt Ollama

Ollama là một giải pháp đơn giản cho phép bạn tải xuống và chạy các mô hình ngôn ngữ như DeepSeek-R1. Để cài đặt nó, hãy làm theo các bước sau:

  1. Trên Linux hoặc macOS, hãy mở terminal và chạy lệnh sau để cài đặt Ollama — gói quăn lại Rõ ràng là cần thiết –:
cuộn tròn -fsSL https://ollama.com/install.sh | sh
  1. Trên hệ thống Windows, hãy đảm bảo bạn đã bật WSL2 trước rồi làm theo các bước tương tự trong thiết bị đầu cuối Ubuntu mà bạn định cấu hình trong WSL.
  2. Xác minh rằng Ollama đã được cài đặt chính xác bằng cách chạy ollama --version. Nếu lệnh trả về số phiên bản, bạn đã sẵn sàng để tiếp tục.

Tải xuống DeepSeek-R1

Với Ollama được cài đặt và chạy (ollama serve trong thiết bị đầu cuối nếu quá trình tải xuống mà chúng tôi giải thích sau không thành công), giờ đây bạn có thể tải xuống mô hình DeepSeek phù hợp nhất với nhu cầu và phần cứng của mình:

  • Thông số 1.5B: Lý tưởng cho các máy tính cơ bản. Mô hình này chiếm khoảng 1.1 GB.
  • Thông số 7B: Đề xuất cho thiết bị có GPU trung bình-cao. Điều này chiếm khoảng 4.7 GB.
  • Thông số 70B: Đối với các nhiệm vụ phức tạp trên thiết bị có công suất lớn bộ nhớ và GPU mạnh mẽ.

Để tải xuống mô hình 7B tiêu chuẩn, hãy chạy lệnh này trong terminal:

Olama Run Deepseek-R1

Thời gian tải xuống sẽ phụ thuộc vào tốc độ Internet của bạn và sẽ chỉ cần thiết trong lần đầu tiên chúng tôi chạy chatbot. Sau khi hoàn thành, mô hình sẽ sẵn sàng để sử dụng từ dòng lệnh hoặc thông qua giao diện đồ họa.

Sử dụng DeepSeek với giao diện đồ họa

Mặc dù bạn có thể tương tác trực tiếp với DeepSeek từ thiết bị đầu cuối nhưng nhiều người dùng thích giao diện đồ họa để thuận tiện hơn. Trong trường hợp này, bạn có thể cài đặt ChatBoxAI, một ứng dụng miễn phí cho phép bạn tận dụng DeepSeek từ hình thức trực quan.

  • Tải xuống và cài đặt ChatBoxAI từ trang chính thức của nó.
  • Đặt ứng dụng để sử dụng Ollama với tư cách là nhà cung cấp mẫu:

Trong cài đặt ChatBoxAI, chọn “Sử dụng API của riêng tôi” và chọn mô hình DeepSeek mà bạn đã tải xuống trước đó. Nếu mọi thứ được cấu hình chính xác, bạn sẽ có thể thực hiện các truy vấn và tác vụ trực tiếp từ giao diện đồ họa.

Tích hợp DeepSeek vào các dự án

Nếu bạn là nhà phát triển, bạn có thể tích hợp DeepSeek vào các dự án của mình bằng cách sử dụng API Tương thích với OpenAI Đây là một ví dụ đơn giản sử dụng Python:

nhập openai client = openai.Client(base_url="http://localhost:11434/v1", api_key="ollama") phản hồi = client.chat.completions.create(model="deepseek-r1", messages=[{ "role": "user", "content": "Tạo mã bằng Python để tính Fibonacci"}])

Tập lệnh này sẽ gửi truy vấn đến mô hình DeepSeek cục bộ và trả về kết quả trong thiết bị đầu cuối hoặc ứng dụng của bạn.

Mô hình AI DeepSeek-R1 đại diện cho một lựa chọn tuyệt vời cho những ai đang tìm kiếm một giải pháp tiên tiến và tiết kiệm. Với khả năng truy cập dễ dàng mà Ollama cung cấp, tính linh hoạt của các mô hình và khả năng tích hợp vào các dự án tùy chỉnh, DeepSeek mở ra những khả năng mới cho các nhà phát triển, sinh viên và chuyên gia AI. Với sự tập trung vào quyền riêng tư và hiệu suất, đây là một công cụ đáng được khám phá kỹ lưỡng.


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.