Nội dung
Open Library có hơn 20 triệu bản ghi sách trong danh mục công cộng. Bạn có thể thu thập siêu dữ liệu bằng Open Library Scraper trên Apify với chi phí khoảng 0,1 cent mỗi cuốn.
Đây là bước khởi đầu. Thu thập dữ liệu về sách đang bán, nhu cầu chủ đề và các khoảng trống thị trường. Sau đó, dùng thông tin này để viết và xuất bản sách của bạn. Nếu thực hiện đúng, bạn có thể biến nó thành nguồn thu nhập thực sự.
Thu nhập của tác giả tự xuất bản trên Amazon Kindle Direct Publishing (KDP) dao động từ 150 USD mỗi tháng (cực thấp) tới 20.000 USD mỗi tháng (cực cao). Sự chênh lệch lớn này phụ thuộc vào mức độ nghiên cứu thị trường trước khi viết.
Tại sao cần thu thập dữ liệu sách?
- Không phải đoán mong muốn độc giả; dữ liệu đã có sẵn.
- Khi scrape Open Library, bạn có thể lấy:
- Thống kê đọc (muốn đọc, đang đọc, đã đọc)
- Tiêu đề và tác giả
- Năm xuất bản đầu tiên và số ấn bản
- ISBN và nhà xuất bản
- Điểm trung bình và số lượng đánh giá
- Số liệu thống kê đọc rất hữu ích. Sắp xếp theo wantToRead cho biết sách nào đang thu hút quan tâm trước khi trở thành bestseller. Nhiều ấn bản thường chỉ ra độ bền của sách. Đánh giá cao nhưng ấn bản ít có thể là dấu hiệu ngách chưa được khai thác.
Cách scrape dữ liệu
- Không cần lập trình, nhưng có lợi.
- Open Library Scraper trên Apify tính phí theo sự kiện: 0,001 USD khi chạy, cộng 0,001 USD cho mỗi sách trích xuất.
- 100 sách ≈ 0,10 USD. 10.000 sách ≈ 10 USD + phí khởi động.
- Nhập từ khóa tìm kiếm (ví dụ: “machine learning”, “historical romance”, “self‑help productivity”) và đặt giới hạn. Trình thu thập trả về dữ liệu có cấu trúc dạng JSON hoặc CSV.
- Người dùng Python có thể dùng Apify client: khởi tạo token API, đặt truy vấn, lấy kết quả vào dataset cá nhân.
Xử lý dữ liệu
- Phân tích để tìm mẫu, không chỉ lưu trong bảng tính.
- Mục tiêu: tìm giao điểm giữa những gì bán chạy và khả năng viết của bạn.
- Ví dụ: trong 500 sách “sustainable agriculture”, nếu không có “soil health tracker” có thể in, đó là khoảng trống.
- Nhận ra các mẫu từ khóa trong phụ đề của nhiều bestseller để làm chỉ báo.
Phân tích bestseller trên Amazon
- Chọn sách trong top 20 của phân mục mục tiêu.
- Xem mục “Customers who bought this also bought”.
- Ghi lại 5 tiêu đề hàng đầu, BSR, giá, số trang và trạng thái Kindle Unlimited.
- Kiểm tra từ khóa lặp lại trong phụ đề.
- Đọc đánh giá 3‑4 sao để biết nhu cầu chưa được đáp ứng.
- Quá trình mất khoảng 90 phút và cung cấp insight hơn cả tháng đoán.
Nền tảng bán sách 2026
- Amazon KDP: chiếm 68 % thị phần ebook indie toàn cầu. Royalties 70 % cho giá $2.99‑$9.99, 35 % ngoài khoảng này. Thanh toán ~60 ngày. Không có dữ liệu độc giả trực tiếp.
- Draft2Digital: lấy 10 % gross royalties, phân phối tới Apple Books, Barnes & Noble, Kobo, Scribd. Tự động xử lý VAT/GST tại 32 quốc gia. Thanh toán 30 ngày. Giảm kiểm soát định dạng nhưng tiết kiệm thời gian.
- Apple Books: royalties 70 % cho mọi giá, thanh toán trong 48 giờ. Yêu cầu định dạng EPUB chuẩn WCAG 2.1 AA. Khoảng 38 % bản nộp lần đầu bị từ chối vì lỗi kỹ thuật.
- IngramSpark: phù hợp cho sách in và phân phối thư viện. Đến 39.000 cửa hàng và thư viện qua OverDrive. Phí thiết lập $49 mỗi định dạng, bắt buộc chiết khấu 40 % wholesale, thanh toán 90 ngày.
- Payhip: bán trực tiếp, không phí hoa hồng, phí cố định $29/năm. Giữ 100 % email và dữ liệu hành vi. Tốt nếu đã có audience.
Giá và gói sản phẩm
- Đối với ebook Amazon, giữ giá $2.99‑$9.99 để được mức royalties 70 %. $4.99 thích hợp cho tiểu thuyết; phi hư cấu có thể lên $7.99‑$9.99.
- Tránh khởi chạy $0.99; có thể tăng thứ hạng tạm thời nhưng giảm giá trị nhận thức và gây giảm thuật toán khi tăng giá.
- Thu nhập thực tế thường đến từ bundling. Ví dụ: tác giả bán ebook $12.99 trên Payhip, kèm toolkit $49 và membership $199 hàng năm, thu lợi nhuận gấp 3 lần so với Amazon.
- Khởi tạo PDF miễn phí làm lead magnet, chuyển 23 % người đăng ký thành khách mua bundle $19.99.
Khía cạnh pháp lý
- Scrape siêu dữ liệu công khai (tiêu đề, tác giả, ISBN, năm xuất bản, rating) thường được chấp nhận. Open Library cung cấp API cho mục đích này.
- Không được scrape nội dung sách hay tài liệu có bản quyền. Các vụ kiện Nvidia, OpenAI, Meta vì dùng sách pirated từ Library Genesis và Anna’s Archive đang diễn ra.
- Tháng 1/2026, khiếu nại hợp nhất cáo buộc Nvidia liên hệ Anna’s Archive để lấy sách vi phạm bản quyền.
- Tháng 2/2026, IAB đề xuất dự thảo luật chịu trách nhiệm AI khi scrape nội dung không có đồng ý.
- Hiện tại, chỉ thu thập metadata và thông tin danh mục để tránh rủi ro pháp lý.
Kindle Unlimited (KDP Select)
- Tham gia KDP Select đưa ebook vào Kindle Unlimited; nhận tiền từ quỹ toàn cầu dựa trên số trang đọc.
- Khoản thanh toán mỗi trang giảm ~12 % trong đầu 2026 do số tác giả tăng.
- Thể loại fiction có tỷ lệ hoàn thành cao (romance, thrillers, cozy mysteries) vẫn có thu nhập ổn định.
- Hoàn thành >85 % trong Q1: $0.0052/trang; <60 %: $0.0038/trang.
- Nhược điểm: độc quyền 90 ngày, không bán ebook ở nơi khác, kể cả website cá nhân.
Xây dựng nhiều nguồn thu
- Không dựa vào một cuốn hoặc một nền tảng.
- Mô hình phổ biến:
- Dùng KDP để khám phá, sau đó chuyển độc giả sang Payhip để giữ 100 % doanh thu.
- Phát hành qua Draft2Digital để tiếp cận kênh thư viện, một số tác giả phi hư cấu bán tốt hơn kênh bán lẻ.
- Xây danh sách email bằng lead magnet (chương mẫu, checklist, template), chuyển đổi 12‑18 % khách mua thành subscriber.
- Bundle sách với workbook, template, hoặc buổi Q&A trực tiếp.
- Ví dụ: một tác giả học thuật chuyển từ Amazon sang Draft2Digital, mở newsletter trả phí, thu nhập tăng từ $287 lên >$4.200/tháng, 87 % từ licensing thư viện và subscription.
Yêu cầu định dạng và kỹ thuật
- Phân phối đa nền tảng: dùng EPUB. Phù hợp Apple Books, Kobo, Google Play, và hầu hết các cửa hàng. KDP cũng chấp nhận EPUB, tính năng “Smart Preview Optimization” tăng thời gian đọc 12‑17 %.
- Sách in: IngramSpark yêu cầu profile màu CMYK và bleed đúng. PDF RGB sẽ tự động chuyển, tăng chi phí $0.87‑$1.32 mỗi bản.
- Apple Books yêu cầu cấu trúc heading, alt text cho hình, và mục lục điều hướng đầy đủ. Giá trị giao dịch trung bình của Apple cao 42 % so với mức trung bình ngành.
Lộ trình thực tiễn
- Tuần 1: Chạy scrape. Chọn 5‑10 từ khóa, lấy dữ liệu 500‑1.000 sách, sắp xếp theo wantToRead và số đánh giá.
- Tuần 2: Phân tích dữ liệu, xác định khoảng trống, mẫu phụ đề, giá, định dạng. So sánh với “Also Bought” của Amazon.
- Tuần 3‑4: Viết dàn ý dựa trên khoảng trống đã tìm.
- Tuần 5‑8: Viết, chỉnh sửa, lấy phản hồi ARCs, đạt 15‑20 review xác thực trong 10 ngày đầu ra mắt.
- Tuần 9: Định dạng manuscript. Sử dụng EPUB cho đa kênh; kiểm tra tiêu chuẩn truy cập Apple nếu cần.
- Tuần 10: Xuất bản. Giá $4.99‑$9.99 tùy thể loại. Đăng ký KDP Select nếu bắt đầu trên Amazon; tải lên Draft2Digital nếu muốn phân phối rộng.
- Tuần 11 trở đi: Giám sát “Also Bought” hàng tuần, điều chỉnh keyword backend nếu sách xuất hiện ngoài danh mục mục tiêu, chạy test quảng cáo nhỏ, mở rộng danh sách email.
Kết quả thực tế
- Không hứa làm giàu nhanh. Hầu hết tác giả không đạt $20.000/tháng, nhưng $1.000‑$5.000/tháng là khả thi.
- Giảng viên đại học xuất bản sách lịch sử 2023, thu $287/tháng. Chuyển sang Draft2Digital cho thư viện, mở newsletter trả phí, đạt trung bình $4.210/tháng vào giữa 2026, trong đó 87 % đến từ licensing và subscription.
- Tác giả nông nghiệp bền vững tung ebook miễn phí tracker, bán bundle $19.99 kèm workbook và Q&A; doanh thu bundle vượt royalties sách hơn 217 %.
- Cả hai đều không cần chi tiêu quảng cáo lớn hay danh tiếng, chỉ dựa vào dữ liệu thị trường và thực thi hiệu quả.
Tham khảo: medium.com

Bài viết liên quan: