Dựng chatbot qua API

Nội dung

    Thử nghiệm Dify, một nền tảng nguồn mở cho phép bạn xây dựng chatbot bằng nhiều LLM (Mô hình ngôn ngữ lớn) khác nhau. Đây là một dự án rất thú vị với hơn 54 nghìn sao trên GitHub. Ý tưởng tạo chatbot mà không cần phải viết bất kỳ mã nào quá hấp dẫn để bỏ qua. Ý tưởng này rất đơn giản: bạn cung cấp cho nền tảng (trên đám mây hoặc tại chỗ) một cơ sở kiến ​​thức, một lời nhắc và một số cấu hình và tích hợp tất cả những thứ này vào một chatbot trong tầm tay bạn mà bạn có thể tích hợp ở bất kỳ đâu hoặc chạy như một giải pháp độc lập.

    Cần lưu ý rằng dữ liệu của bạn không chỉ là họ và tên, địa chỉ, ngày sinh… mà còn là địa chỉ IP của bạn, phương thức kết nối của bạn, loại máy tính, hệ điều hành, trình duyệt cho phép, bằng cách tham chiếu chéo, nhận dạng bạn trên mạng (đôi khi thậm chí sử dụng VPN). Tất cả các trang web có thể được sử dụng miễn phí, miễn là dữ liệu được ẩn danh …

    https://medium.com/open-business-ideas/building-no-code-ai-chatbots-with-dify-in-4-steps-d6be45eb3856

    AI in Nextcloud: what, why and how

    Ví dụ, bạn có thể có một kế hoạch định giá phức tạp và muốn giúp khách hàng tìm ra kế hoạch tốt nhất cho nhu cầu của họ. Danh sách này còn dài nữa.
    Tôi sẽ sử dụng Dify trong hướng dẫn này để tạo một chatbot giúp tôi trả lời các câu hỏi về CV của mình, nhưng công nghệ này có thể được sử dụng theo nhiều cách khác nhau. Hãy cùng xem nó hoạt động như thế nào. Để chứng minh các khả năng cốt lõi của nền tảng này, chúng ta sẽ tạo một chatbot có thể trả lời các câu hỏi về CV của bạn và khớp với các mô tả công việc tiềm năng do nhà tuyển dụng, phòng nhân sự hoặc nhà tuyển dụng gửi. Hãy bắt đầu nào!

    Vậy chúng ta hãy bắt đầu nhé!

    Các bước cấp cao:

    • Tạo một chatbot mới
    • Xác định lời nhắc
    • Chọn LLM để sử dụng (ở đây là GPT-4o-mini)
    • Nhúng hoặc cung cấp nó như một ứng dụng độc lập để chia sẻ

    Hướng dẫn từng bước:

    1. Truy cậpDifyvà đăng ký (miễn phí).
    2. VàoBảng điều khiển.
    3. Nhấp vào Studio > Chatbot.

    Đặt tên cho chatbot của bạn và tùy ý chọn một biểu tượng.

    Bạn có thể tải xuống các biểu tượng miễn phí từFreepikhoặc bất kỳ nền tảng nào khác nếu bạn thích.

    Màn hình bên dưới hiển thị cấu hình của chatbot. Bạn có thể tùy chỉnh nhiều thứ, chẳng hạn như liên kết đến cơ sở kiến ​​thức, thêm biến và thiết lập các tùy chọn lạ mắt như lệnh thoại, đọc to, hiển thị trích dẫn và nhiều hơn nữa. Nhưng hãy giữ mọi thứ đơn giản ngay bây giờ và chỉ tập trung vào cốt lõi của chatbot, lời nhắc.

    Bây giờ hãy nhập lời nhắc bên dưới vào hộp hướng dẫn.

    Đảm bảo thêm sơ yếu lý lịch của bạn vào cuối lời nhắc.

    Đối với các tài liệu rất dài hoặc nhiều tài liệu, có cái gọi là cơ sở kiến ​​thức hiệu quả hơn nhiều, nhưng vì mục đích đơn giản, chúng ta có thể đưa lời nhắc vào ngữ cảnh. Điều này sẽ mang lại cho chúng ta kết quả thậm chí còn tốt hơn so với việc tinh chỉnh. Một RAG với kỹ thuật phân đoạn và phức tạp hơn là không cần thiết tại thời điểm này.

    <hướng dẫn> 
    Trước tiên, yêu cầu người dùng cung cấp mô tả công việc. 
    Sau đó , sử dụng các hướng dẫn sau để  so sánh mô tả công việc vớiyếu lý lịch  từ ngữ cảnh:
    So sánh mô tả công việc được cung cấp với sơ yếu lý lịch . 
    Xác định  chỉ liệt kê các kết quả khớp chính xác giữa các yêu cầu công việc trình độ của ứng viên . Không 
    bao  gồm bất kỳ thông tin suy ra hoặc giả định nào - chỉ liệt kê 100% các kết quả khớp có thể xác minh được. Định dạng đầu ra như sau: Mỗi yêu cầu từ mô tả công việc được in đậm ( sử dụng ##) Sử dụng "Kết quả khớp:" để giới thiệu thông tin khớp từ sơ yếu lý lịch Đối với mỗi kết quả khớp, hãy hiển thị vai trò, công ty  thời gian ( sử dụng ###) Bên dưới, hãy liệt kê các nhiệm vụ hoặc kinh nghiệm liên quan dưới dạng dấu đầu dòng Không bao gồm bất kỳ thẻ XML nào trong đầu ra. Nếu không có kết quả khớp nào cho một yêu cầu cụ thể, hãy nêu "Không tìm thấy kết quả khớp chính xác nào trong sơ yếu lý lịch". Sử dụng trích dẫn chính xác từ sơ yếu lý lịch - không tóm tắt hoặc diễn đạt lại. Không bịa đặt hoặc giả định bất kỳ thông tin nào không được cung cấpràng trong  yếu  lịch . Hiển thị tất cả các kết quả khớp cho từng yêu cầu. Cuối cùng , hãy thêm phần giới thiệu có tiêu đề "Giới thiệu:" để gợi ý liệu ứng viên  phù hợp với vị trí hay không chỉ dựa trên các kết quả phù hợp tìm được. Ví dụ về định dạng đầu ra: [Yêu cầu từ mô tả công việc] Phù hợp: [Vai trò] tại [Công ty], [Thời hạn][Nhiệm vụ hoặc kinh nghiệm liên quan từ sơ yếu lý lịch ] [Nhiệm vụ hoặc kinh nghiệm liên quan khác từ sơ yếu lý lịch ][Nhiệm vụ có liên quan khác] tại [Công ty], [Thời hạn][Nhiệm vụ hoặc kinh nghiệm liên quan khác từ sơ yếu lý lịch ][Yêu cầu khác từ mô tả công việc] Phù hợp: [Vai trò] tại [Công ty], [Thời hạn][Nhiệm vụ hoặc kinh nghiệm liên quan từ
    tiếp tục ][Yêu cầu không  kết quả khớp] 
    Không tìm thấy kết quả khớp chính xác nào trong sơ yếu lý lịch . [ 
    Tiếp tục  cho tất cả các yêu cầu] 
    Đề xuất:
     [Đề xuất dựa trên các kết quả khớp được tìm thấy] 
    Vui lòng cung cấp mô tả công việc để tôi có thể thực hiện phân tích này bằng cách sử dụngyếu lý lịch  từ ngữ cảnh. 
    </instruction>SỬ DỤNG SƠ YẾU LÝ LỊCH NÀY >>>>> SAO CHÉP DÁN SƠ YẾU LÝ LỊCH CỦA BẠN TẠI ĐÂY

    Nếu bạn chỉ muốn thử nghiệm, bạn có thể sử dụng mẫu sơ yếu lý lịch này:

    John  Doe 
    123  Main  Street,  Anytown,  Hoa Kỳ  12345 
    Điện thoại:  (555)  123 -4567  |  Email:  john.doe@email.com
    TÓM TẮT 
    Kỹ sư phần mềm giàu kinh nghiệm với nền tảng vững chắc về phát triển web và công nghệ đám mây. Đam mê tạo ra các giải pháp hiệu quả và có thể mở rộng.GIÁO 
    DỤC Cử nhân Khoa học Máy tính 
    Đại học Công nghệ, Tốt nghiệp: Tháng 5 năm 2018KINH NGHIỆM LÀM VIỆCKỹ sư phần mềm cao cấp 
    TechCorp Inc., Tháng 6 năm 2021 - Hiện tại 
    - Dẫn dắt phát triển nền tảng thương mại điện tử có lưu lượng truy cập cao bằng React và Node.js 
    - Triển khai các đường ống CI/CD bằng Jenkins, giảm thời gian triển khai 40% 
    - Hướng dẫn các nhà phát triển cấp dưới và tiến hành đánh giá mãNhà phát triển phần
     mềm WebSolutions LLC, Tháng 8 năm 2018 - Tháng 5 năm 2021 
    - Phát triển và duy trì API RESTful bằng Python và Django 
    - Tối ưu hóa các truy vấn cơ sở dữ liệu, cải thiện hiệu suất ứng dụng 25% 
    - Hợp tác với nhóm UX để triển khai các thiết kế đáp ứngKỸ NĂNG 
    - Ngôn ngữ lập trình: Python, JavaScript, Java 
    - Công nghệ web: React, Node.js, Django, HTML5, CSS3 
    - Cơ sở dữ liệu: MySQL, MongoDB, PostgreSQL 
    - Nền tảng đám mây: AWS (EC2, S3, Lambda)

    Sau khi nhập lời nhắc, hãy đảm bảo chọn LLM mong muốn.

    Trước khi thực sự bắt đầu thử nghiệm, chúng ta cần chọn mô hình để sử dụng.

    Tôi đang sử dụng trong hướng dẫn này là GPT-4o-mini giá rẻ nhưng mạnh mẽ. Có một số mẫu mặc định là miễn phí từ Dify; tuy nhiên, một số mẫu yêu cầu bạn phải sử dụng khóa API của riêng mình. Với điều này, bạn có thể khắc phục những hạn chế của phiên bản miễn phí, tuy nhiên, hãy cân nhắc đến việc kiểm soát chi phí. Hiện tại, GPT-4o-mini có giá khoảng 0,15 đô la cho một triệu token, khá ổn. Bạn có thể tìm hiểu thêm về giá của APItại đây.

    Bạn có thể tự quyết định sử dụng mô hình nào. Đối với phần còn lại của hướng dẫn này, chúng tôi sẽ sử dụng khóa API của riêng mình.

    Khóa API có thể được thiết lập trong phần cài đặt như hiển thị bên dưới.

    Bây giờ chúng ta có thể lựa chọn từ nhiều mô hình khác nhau vì chúng ta đang sử dụng khóa API của riêng mình. Chọn GPT-4o-mini.

    Chúng ta đã hoàn tất việc cấu hình chatbot (Prompt + LLM) và bây giờ chúng ta có thể thực sự bắt đầu thử nghiệm nó với mô tả công việc thực tế để khớp với sơ yếu lý lịch.

    Để thử nghiệm, bạn có thể sử dụng mô tả công việc sau:

    Nhà phát triển Full Stack cao cấp
    Về chúng tôi: 
    Chúng tôi là một công ty khởi nghiệp công nghệ đang phát triển nhanh chóng đang tìm kiếm một Senior Full Stack Developer tài năng để  tham gia vào nhóm sáng tạo của chúng tôi. Chúng tôi đang xây dựng các ứng dụng web tiên tiến đang thay đổi cách thức hoạt động của các doanh nghiệp. Trách nhiệm:
     - Thiết kế, phát triển  bảo trì các ứng dụng web bằng React  Node.js 
    - Hợp tác với các nhóm chức năng chéo để xác định  triển khai các tính năng mới
     - Tối ưu hóa hiệu suất  khả năng mở rộng của ứng dụng 
    - Triển khai  bảo trì các đường ống CI/CD 
    - Hướng dẫn các nhà phát triển cơ sở  tiến hành đánh giá mã 
    - Tham gia vào các quy trình phát triển nhanh nhẹn Yêu cầu: 
    - Bằng cử nhân Khoa học máy tính hoặc lĩnh vực liên quan
     - 5 năm kinh nghiệm trở lên trong phát triển web đầy đủ 
    - Thành thạo thiết kế React, Node.js  RESTful API 
    - Kinh nghiệm với các nền tảng đám mây, tốt nhất là AWS 
    - Quen thuộc với các quy trình  công cụ CI/CD 
    - Kiến thức về thiết kế  tối ưu hóa cơ sở dữ liệu (SQL  NoSQL) 
    - Kinh nghiệm với các phương pháp phát triển nhanh nhẹn 
    - Kỹ năng giải quyết vấn đề  giao tiếp tuyệt vời Sẽ rất tuyệt nếu có: 
    - Kinh nghiệm với kiến ​​trúc vi dịch vụ 
    - Quen thuộc với các công nghệ chứa (ví dụ: Docker) 
    - Đóng góp cho các dự án nguồn mở Chúng tôi cung cấp mức lương cạnh tranh, giờ làm việc linh hoạt  hội phát triển chuyên môn trong môi trường khởi nghiệp năng động.

    Sau khi nhập mô tả công việc, kết quả trông khá tốt.

    Hãy sử dụng phiên bản này làm phiên bản ban đầu. Hãy nhớ rằng, bạn luôn có thể lặp lại và cập nhật cấu hình, mô hình nhắc nhở, v.v. sau đó và cập nhật phiên bản trực tiếp chỉ bằng một cú nhấp chuột.

    Bây giờ chúng ta thực sự có thể bắt đầu sử dụng và chia sẻ nó. Về cơ bản, chúng ta có hai lựa chọn: cung cấp nó như một ứng dụng độc lập hoặc nhúng nó vào một trang web hiện có (như trang web sơ yếu lý lịch hoặc hồ sơ mà bạn đang lưu trữ). Hãy bắt đầu với lựa chọn đầu tiên: kiểm tra ứng dụng độc lập.

    Bắt đầu một cuộc trò chuyện mới và thử nghiệm. Tối ưu hóa lời nhắc và nhấn cập nhật nếu cần.

    Tùy chọn 2: Nhúng vào một trang web hiện có

    Đây cũng là một tính năng rất hay nếu bạn đã có trang web với hồ sơ của mình, nơi bạn có thể thêm một số tương tác. Đối với điều này, chỉ cần nhấn vào nhúng vào trang web và sao chép mã vào trang web của bạn như mô tả bên dưới.

    Bây giờ hãy dán mã vào bất cứ đâu trên trang web của bạn.

    Nếu mọi việc suôn sẻ, bây giờ bạn sẽ thấy ở cuối trang web của mình một biểu tượng bật lên cửa sổ trò chuyện, nơi khách hàng/người tìm việc/nhà tuyển dụng có thể đặt câu hỏi và so sánh sơ yếu lý lịch của bạn.

    Và thế là xong!

    Bây giờ bạn có thể thêm các cuộc hội thoại hỗ trợ AI vào bất kỳ nội dung tĩnh nào bạn có hoặc cung cấp chúng dưới dạng ứng dụng độc lập chỉ bằng vài cú nhấp chuột. Dify cung cấp hàng chục tính năng như thu thập khách hàng tiềm năng từ chatbot, hỗ trợ giọng nói và nhiều tính năng khác. Vui lòng tham khảo tài liệu để biết thêm về các tính năng khác.

    Tôi nhận được hàng tá đề xuất công việc và dự án và đôi khi những công việc này không phù hợp với kỹ năng của tôi. Tôi biết rằng những người không phải dân kỹ thuật khó có thể dễ dàng đánh giá liệu một công việc CNTT có thực sự phù hợp hay không. Ví dụ, nếu một công ty đang tìm kiếm một chuyên gia về đám mây và họ không đề cập đến bất kỳ đám mây cụ thể nào nhưng bạn có kinh nghiệm về AWS và Azure được đề cập trong sơ yếu lý lịch của mình, thì làm sao một người không phải dân kỹ thuật có thể biết rằng bạn có thể là người phù hợp mặc dù thuật ngữ Cloud không được đề cập trong sơ yếu lý lịch của bạn vì bạn đề cập đến đám mây cụ thể mà bạn đã làm việc cùng… trong khoa học, AI có thể giúp ích rất nhiều. Tuy nhiên, nhiều công ty và nhà tuyển dụng vẫn chưa áp dụng AI vì nhiều lý do, nhưng tôi chắc chắn rằng họ sẽ sớm áp dụng:)
    Nhưng trước khi làm như vậy, bạn có thể đơn giản hóa quy trình và thậm chí nổi bật với sơ yếu lý lịch của mình bằng cách thêm một số tính tương tác bằng cách sử dụng chatbot AI thực hiện chính xác điều đó. bạn có thể cho anh ấy biết chính xác điều gì cần tập trung và cách tương tác bằng ngôn ngữ tự nhiên theo cách bạn sử dụng Chatpgt… hãy coi đó là cuộc phỏng vấn đầu tiên với khách hàng/nhà tuyển dụng/người tuyển dụng tiềm năng… hãy xem cách này hiệu quả như thế nào.

    Chúng tôi sử dụng Dify, một nền tảng chatbot và quy trình làm việc AI tuyệt vời, nơi bạn có thể tạo chatbot bằng cách sử dụng nhiều loại lLM như gpt, claude, v.v., cung cấp lời nhắc của bạn và tích hợp nó trên bất kỳ trang web nào hoặc cung cấp nó dưới dạng ứng dụng độc lập mà không cần cài đặt hoặc mã hóa bất kỳ thứ gì.. thật tuyệt vời phải không? Khái niệm hoặc ý tưởng về chatbot này có thể được áp dụng cho nhiều scneairso khác, nhưng chúng tôi sẽ sử dụng nó cho trường hợp sử dụng được đề cập ở trên..

    Vậy chúng ta hãy cùng bắt tay vào làm nhé.

    Sau đây là các bước ở cấp độ cao:

    • Tạo một chatbot mới
    • xác định lời nhắc
    • chọn llm để sử dụng (ở đây là gpt-4o-mini)
    • nhúng nó hoặc cung cấp như một ứng dụng độc lập để chia sẻ

    Từng bước một:

    1. điều hướng đếnhttps://dify.ai/và đăng ký (miễn phí)
    2. ĐI ĐẾN BẢNG ĐIỀU KHIỂNhttps://cloud.dify.ai/apps
    3. Nhấp vào studio > Chatbot

    Đặt tên cho chatbot của bạn và tùy ý chọn một biểu tượng…

    Bạn có thể tải xuống các biểu tượng miễn phí trênFreepikhoặc bất kỳ nền tảng nào khác nếu bạn thích

    Màn hình bên dưới hiển thị cho bạn cấu hình của chatbot.. bạn có thể tùy chỉnh nhiều thứ, như liên kết đến cơ sở kiến ​​thức (chúng ta sẽ tìm hiểu sau), thêm biến và thiết lập các tùy chọn lạ mắt như đọc lệnh thoại, hiển thị trích dẫn và nhiều thứ khác nữa. Nhưng hãy giữ mọi thứ đơn giản ngay bây giờ và chỉ tập trung vào cốt lõi của chatbot, lời nhắc.

    Bây giờ hãy nhập lời nhắc bên dưới vào hộp hướng dẫn…

    đảm bảo thêm sơ yếu lý lịch của bạn vào cuối lời nhắc.

    đối với các tài liệu rất dài hoặc nhiều tài liệu, có cái gọi là cơ sở kiến ​​thức hiệu quả hơn nhiều, nhưng vì mục đích đơn giản, chúng ta có thể đưa lời nhắc vào contxt. Điều này sẽ mang lại cho chúng ta kết quả thậm chí còn tốt hơn là tinh chỉnh. Một RAG với các đoạn tezczniquene và độ phức tạp hơn không cần thiết tại thời điểm này.

    <hướng dẫn> 
    Trước tiên, yêu cầu người dùng cung cấp mô tả công việc. 
    Sau đó , sử dụng các hướng dẫn sau để  so sánh mô tả công việc vớiyếu lý lịch  từ ngữ cảnh:
    So sánh mô tả công việc được cung cấp với sơ yếu lý lịch . 
    Xác định  chỉ liệt kê các kết quả khớp chính xác giữa các yêu cầu công việc trình độ của ứng viên . Không 
    bao  gồm bất kỳ thông tin suy ra hoặc giả định nào - chỉ liệt kê 100% các kết quả khớp có thể xác minh được. Định dạng đầu ra như sau: Mỗi yêu cầu từ mô tả công việc được in đậm ( sử dụng ##) Sử dụng "Kết quả khớp:" để giới thiệu thông tin khớp từ sơ yếu lý lịch Đối với mỗi kết quả khớp, hãy hiển thị vai trò, công ty  thời gian ( sử dụng ###) Bên dưới, hãy liệt kê các nhiệm vụ hoặc kinh nghiệm liên quan dưới dạng dấu đầu dòng Không bao gồm bất kỳ thẻ XML nào trong đầu ra. Nếu không có kết quả khớp nào cho một yêu cầu cụ thể, hãy nêu " Không tìm thấy kết quả khớp chính xác nào trong sơ yếu lý lịch". Sử dụng trích dẫn chính xác từ sơ yếu lý lịch - không tóm tắt hoặc diễn đạt lại. Không bịa đặt hoặc giả định bất kỳ thông tin nào không được cung cấp rõ ràng trongyếu lý lịch . Hiển thị tất cả các kết quả khớp cho từng yêu cầu. Cuối cùng , hãy thêm phần giới thiệu có tiêu đề "Giới thiệu:" để gợi ý liệu ứng viên  phù hợp với vị trí hay không chỉ dựa trên các kết quả phù hợp tìm được. Ví dụ về định dạng đầu ra: [Yêu cầu từ mô tả công việc] Phù hợp: [Vai trò] tại [Công ty], [Thời hạn][Nhiệm vụ hoặc kinh nghiệm liên quan từ sơ yếu lý lịch ] [Nhiệm vụ hoặc kinh nghiệm liên quan khác từ sơ yếu lý lịch ][Nhiệm vụ có liên quan khác] tại [Công ty], [Thời hạn][Nhiệm vụ hoặc kinh nghiệm liên quan khác từ sơ yếu lý lịch ][Yêu cầu khác từ mô tả công việc] Phù hợp: [Vai trò] tại [Công ty], [Thời hạn][Nhiệm vụ hoặc kinh nghiệm liên quan từ
    tiếp tục ][Yêu cầu không  kết quả khớp] 
    Không tìm thấy kết quả khớp chính xác nào trong sơ yếu lý lịch . [ 
    Tiếp tục  cho tất cả các yêu cầu] 
    Đề xuất:
     [Đề xuất dựa trên các kết quả khớp được tìm thấy] 
    Vui lòng cung cấp mô tả công việc để tôi có thể thực hiện phân tích này bằng cách sử dụngyếu lý lịch  từ ngữ cảnh. 
    </instruction> 
    SỬ DỤNG SƠ YẾU LÝ LỊCH NÀY >>>>> SAO CHÉP DÁN SƠ YẾU LÝ LỊCH CỦA BẠN TẠI ĐÂY

    Nếu bạn chỉ muốn thế, bạn có thể sử dụng mẫu sơ yếu lý lịch này

    John  Doe 
    123  Main  Street,  Anytown,  Hoa Kỳ  12345 
    Điện thoại:  (555)  123 -4567  |  Email:  john.doe@email.com
    TÓM TẮT 
    Kỹ sư phần mềm giàu kinh nghiệm với nền tảng vững chắc về phát triển web và công nghệ đám mây. Đam mê tạo ra các giải pháp hiệu quả và có thể mở rộng.GIÁO 
    DỤC Cử nhân Khoa học Máy tính 
    Đại học Công nghệ, Tốt nghiệp: Tháng 5 năm 2018KINH NGHIỆM LÀM VIỆCKỹ sư phần mềm cao cấp 
    TechCorp Inc., Tháng 6 năm 2021 - Hiện tại 
    - Dẫn dắt phát triển nền tảng thương mại điện tử có lưu lượng truy cập cao bằng React và Node.js 
    - Triển khai các đường ống CI/CD bằng Jenkins, giảm thời gian triển khai 40% 
    - Hướng dẫn các nhà phát triển cấp dưới và tiến hành đánh giá mãNhà phát triển phần
     mềm WebSolutions LLC, Tháng 8 năm 2018 - Tháng 5 năm 2021 
    - Phát triển và duy trì API RESTful bằng Python và Django 
    - Tối ưu hóa các truy vấn cơ sở dữ liệu, cải thiện hiệu suất ứng dụng 25% 
    - Hợp tác với nhóm UX để triển khai các thiết kế đáp ứngKỸ NĂNG 
    - Ngôn ngữ lập trình: Python, JavaScript, Java 
    - Công nghệ web: React, Node.js, Django, HTML5, CSS3 
    - Cơ sở dữ liệu: MySQL, MongoDB, PostgreSQL 
    - Nền tảng đám mây: AWS (EC2, S3, Lambda)

    Sau khi nhập lời nhắc, hãy đảm bảo chọn LLM mong muốn.

    Trước khi chúng ta có thể bắt đầu thử nghiệm, chúng ta cần chọn mô hình để sử dụng.

    Tôi đang sử dụng gpt-4o-mini giá rẻ nhưng mạnh mẽ trong hướng dẫn này. Có một số mô hình mặc định miễn phí từ dify, tuy nhiên một số yêu cầu bạn sử dụng khóa api của riêng mình. Với điều này, bạn có thể khắc phục những hạn chế của phiên bản efree, tuy nhiên hãy cân nhắc đến việc kiểm soát chi phí… Hiện tại, gpt-4o-mini có giá khoảng 0,15 đô la cho một triệu token, khá ổn. Bạn có thể tìm hiểu thêm về giá của APItại đây

    Bạn có thể tự quyết định sử dụng mô hình nào, trong phần còn lại của hướng dẫn này, chúng ta sẽ sử dụng khóa API của riêng mình.

    Khóa API có thể được thiết lập trong phần cài đặt như hiển thị bên dưới.

    bây giờ chúng ta có thể lựa chọn từ nhiều mô hình khác nhau vì chúng ta sử dụng khóa API của riêng mình.. chọn gpt-4o-mini.

    bây giờ chúng ta đã hoàn tất việc cấu hình chatbot (Prompt + llm) và bây giờ chúng ta có thể thực sự bắt đầu thử nghiệm nó với mô tả công việc thực tế để khớp với sơ yếu lý lịch

    Đối với mục đích thử nghiệm, bạn có thể sử dụng mô tả công việc sau

    Nhà phát triển Full Stack cao cấp
    Về chúng tôi: 
    Chúng tôi là một công ty khởi nghiệp công nghệ đang phát triển nhanh chóng đang tìm kiếm một Senior Full Stack Developer tài năng để  tham gia vào nhóm sáng tạo của chúng tôi. Chúng tôi đang xây dựng các ứng dụng web tiên tiến đang thay đổi cách thức hoạt động của các doanh nghiệp. Trách nhiệm:
     - Thiết kế, phát triển  bảo trì các ứng dụng web bằng React  Node.js 
    - Hợp tác với các nhóm chức năng chéo để xác định  triển khai các tính năng mới
     - Tối ưu hóa hiệu suất  khả năng mở rộng của ứng dụng 
    - Triển khai  bảo trì các đường ống CI/CD 
    - Hướng dẫn các nhà phát triển cơ sở  tiến hành đánh giá mã 
    - Tham gia vào các quy trình phát triển nhanh nhẹn Yêu cầu: 
    - Bằng cử nhân Khoa học máy tính hoặc lĩnh vực liên quan
     - 5 năm kinh nghiệm trở lên trong phát triển web đầy đủ 
    - Thành thạo thiết kế React, Node.js  RESTful API 
    - Kinh nghiệm với các nền tảng đám mây, tốt nhất là AWS 
    - Quen thuộc với các quy trình  công cụ CI/CD 
    - Kiến thức về thiết kế  tối ưu hóa cơ sở dữ liệu (SQL  NoSQL) 
    - Kinh nghiệm với các phương pháp phát triển nhanh nhẹn 
    - Kỹ năng giải quyết vấn đề  giao tiếp tuyệt vời Sẽ rất tuyệt nếu có: 
    - Kinh nghiệm với kiến ​​trúc vi dịch vụ 
    - Quen thuộc với các công nghệ chứa (ví dụ: Docker) 
    - Đóng góp cho các dự án nguồn mở Chúng tôi cung cấp mức lương cạnh tranh, giờ làm việc linh hoạt  hội phát triển chuyên môn trong môi trường khởi nghiệp năng động.

    sau khi nhập mong muốn công việc, kết quả trông khá tốt ..

    Hãy sử dụng phiên bản này làm phiên bản đầu tiên.. hãy nhớ rằng bạn luôn có thể lặp lại và cập nhật cấu hình, mô hình nhắc nhở, v.v. sau đó và cập nhật phiên bản trực tiếp chỉ bằng một cú nhấp chuột.

    Bây giờ chúng ta có thể thực sự bắt đầu sử dụng và chia sẻ nó… Về cơ bản, chúng ta có hai lựa chọn, hoặc cung cấp nó như một ứng dụng độc lập

    hoặc nhúng nó vào một trang web hiện có (như trang web reusme hoặc trang web hồ sơ mà bạn đang lưu trữ). Hãy bắt đầu với tùy chọn đầu tiên: kiểm tra ứng dụng độc lập:

    Bắt đầu một cuộc trò chuyện mới và chơi xung quanh. Tối ưu hóa lời nhắc và nhấn cập nhật. nếu cần thiết

    Optino 2: nhúng vào trang web hiện có.

    Đây cũng là một tính năng rất hay nếu bạn đã có trang web với hồ sơ của mình, nơi bạn có thể thêm một số tính năng tương tác. Để thực hiện, chỉ cần nhấp vào nhúng vào trang web và sao chép mã vào trang web của bạn như mô tả bên dưới.

    Bây giờ hãy dán mã vào bất cứ đâu trên trang web của bạn.

    Nếu mọi việc diễn ra tốt đẹp, bạn sẽ thấy ở cuối trang web của mình một biểu tượng bật lên cửa sổ trò chuyện, nơi khách hàng/người tìm việc/người tuyển dụng có thể đặt câu hỏi và so sánh sơ yếu lý lịch của bạn.

    Với cách tiếp cận này, bạn có thể thêm trí thông minh nhân tạo (AI) vào bất kỳ nội dung tĩnh nào bạn có hoặc cung cấp nó như một ứng dụng độc lập chỉ bằng vài cú nhấp chuột.

    Có hàng chục tính năng như thu thập thông tin khách hàng tiềm năng từ chatbot, hỗ trợ bằng giọng nói và nhiều tính năng khác. Vui lòng tham khảo tài liệu để biết thêm về các tính năng khác.

    Giải pháp phần mềm mã nguồn mở

    https://juris-tyr.com/artificial-intelligence-open-source/#serge

    MultiPDF Chat App

    https://github.com/alejandro-ao/ask-multiple-pdfs

    Tool ask pdf ChatPDF cho phép bạn tải lên bất kỳ tệp PDF nào và tương tác với nó như ChatGPT. Một số sinh viên sử dụng nó để tự động tạo thẻ ghi chú và giải thích các khái niệm dựa trên ghi chú bài giảng và bài đọc. Hiện có một số dịch vụ tương tự, nhưng ChatPDF là dịch vụ dễ sử dụng nhất trong số những dịch vụ không yêu cầu thanh toán/đăng ký. Miễn phí tải xuống tối đa 3 tệp PDF mỗi ngày, với tối đa 120 trang trong mỗi tệp PDF

    Consensus.app: Công cụ tìm kiếm sử dụng AI để tìm thông tin trong các bài báo nghiên cứu.

    https://www.perplexity.ai/ Có nhiều tổng hợp thông tin. Nghiên cứu chủ đề như có PhD. Nhược điểm: Không phải “cây viết” đắc lực.

    Xem thêm các báo cáo: https://www.toolify.ai/Best-trending-AI-Tools

    Xây dựng ứng dụng OCR của riêng bạn bằng mô hình Llama 3.2 từ Ollama

    Use Anakin AI to manage them all!

    Bước 1: Cài đặt Ollama
    Ollama là một nền tảng cho phép bạn chạy các mô hình đa phương thức cục bộ. Để cài đặt Ollama, hãy làm theo các bước sau:

    Tải xuống Ollama : Truy cập trang web chính thức của Ollama và tải xuống gói cài đặt phù hợp với hệ điều hành của bạn.
    Cài đặt Ollama : Làm theo lời nhắc cài đặt để hoàn tất quá trình thiết lập.
    Bước 2: Cài đặt mô hình Llama 3.2-Vision
    Sau khi cài đặt Ollama, bạn có thể cài đặt mô hình Llama 3.2-Vision bằng cách thực hiện lệnh sau trong terminal:

    ollama chạy llama3 .2 -vision
    Lệnh này tải xuống và thiết lập mô hình để sử dụng cục bộ.

    Bước 3: Thiết lập môi trường Python của bạn
    Bây giờ bạn đã cài đặt mọi thứ, hãy thiết lập môi trường Python cho dự án OCR của chúng ta:

    Tạo một thư mục mới cho dự án của bạn :
    mkdir llama-ocr && cd llama-ocr
    Tạo môi trường ảo (tùy chọn nhưng được khuyến nghị):
    python -m venv venv
    source venv/bin/activate # Trên Windows sử dụng `venv\\\\Scripts\\\\activate`
    Cài đặt các thư viện bắt buộc : Bạn sẽ cần một số thư viện để xử lý hình ảnh và mã hóa base64. Cài đặt chúng bằng pip:
    pip cài đặt yêu cầu Gối
    Bước 4: Viết tập lệnh OCR của bạn
    Bây giờ là lúc viết tập lệnh Python sẽ thực hiện OCR bằng Llama 3.2-Vision. Tạo một tệp mới có tên ollama_ocr.pyvà thêm mã sau:

    import base64
    import requests
    from PIL import Image

    SYSTEM_PROMPT = “””Hoạt động như một trợ lý OCR. Phân tích hình ảnh được cung cấp và:
    1. Nhận dạng tất cả văn bản hiển thị trong hình ảnh một cách chính xác nhất có thể.
    2. Duy trì cấu trúc và định dạng gốc của văn bản.
    3. Nếu bất kỳ từ hoặc cụm từ nào không rõ ràng, hãy chỉ ra điều này bằng [unclear] trong bản ghi chép của bạn.
    Chỉ cung cấp bản ghi chép mà không có bất kỳ bình luận bổ sung nào.”””
    def encode_image_to_base64 ( image_path ):
    “””Chuyển đổi tệp hình ảnh thành chuỗi được mã hóa base64.”””
    with open (image_path, “rb” ) as image_file:
    return base64.b64encode(image_file.read()).decode( ‘utf-8’ )
    def perform_ocr ( image_path ):
    “””Thực hiện OCR trên hình ảnh đã cho bằng Llama 3.2-Vision.”””
    base64_image = encode_image_to_base64(image_path)
    response = requests.post(
    “<http://localhost:8080/chat>” , # Đảm bảo URL này khớp với điểm cuối dịch vụ Ollama của bạn
    json={
    “model” : “llama3.2-vision” ,
    “messages” : [
    {
    “role” : “user” ,
    “content” : SYSTEM_PROMPT,
    “images” : [base64_image],
    },
    ],
    }
    )
    if response.status_code == 200 :
    return response.json().get( “message” , {}).get( “content” , “” )
    else :
    print ( “Error:” , response.status_code, response.text)
    return None
    if __name__ == “__main__” :
    image_path = “path/to/your/image.jpg” # Thay thế bằng đường dẫn hình ảnh của bạn
    result = perform_ocr(image_path)
    if result:
    print ( “OCR Recognition Result:” )
    print (result)
    Giải thích về Bộ luật

    Mã hóa Base64 : Hàm này encode_image_to_base64đọc tệp hình ảnh và chuyển đổi nó thành chuỗi base64, cần thiết để gửi hình ảnh qua yêu cầu HTTP.
    Thực hiện OCR : perform_ocrChức năng này gửi yêu cầu POST đến dịch vụ Ollama cục bộ với lời nhắc hệ thống và hình ảnh được mã hóa base64.
    Xử lý phản hồi : Tập lệnh kiểm tra xem yêu cầu có thành công hay không và lấy văn bản được nhận dạng từ phản hồi JSON.
    Bước 5: Chạy tập lệnh OCR của bạn
    Để chạy tập lệnh của bạn, hãy thay thế “path/to/your/image.jpg” bằng đường dẫn thực tế của tệp hình ảnh bạn muốn phân tích. Sau đó thực thi tập lệnh trong terminal của bạn:

    python ollama_ocr.py
    Bạn sẽ thấy kết quả tương tự như thế này:

    Kết quả nhận dạng OCR :
    Văn bản được nhận dạng từ hình ảnh của bạn sẽ được hiển thị ở đây.
    Bước 6: Tối ưu hóa kết quả
    Nếu bạn thấy kết quả OCR không như mong muốn, hãy cân nhắc điều chỉnh SYSTEM_PROMPTbiến trong tập lệnh của bạn để phù hợp hơn với trường hợp sử dụng cụ thể hoặc cải thiện độ rõ ràng trong hướng dẫn cung cấp cho Llama 3.2-Vision.

    Để lại một bình luận

    Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *