
Review Paten Google: Information Gain sebagai Metode Ranking Web Pages
Google tidak lagi hanya menilai “dokumen terbaik”, tetapi “dokumen yang menambah pengetahuan baru bagi pengguna”.
Paten US 12,013,887 B2 – Contextual Estimation of Link Information Gain memperjelas arah Google dalam membangun sistem ranking berbasis information novelty, user interaction history, dan document-to-document differentiation.
Dalam konteks ini, Information Gain bukan sekadar kualitas konten, tetapi seberapa besar informasi baru yang diberikan suatu dokumen dibandingkan dokumen yang sudah dikonsumsi pengguna sebelumnya.
Ini adalah pergeseran besar dari:
relevance statis → relevance kontekstual
ranking berbasis query → ranking berbasis user knowledge state
Isu yang Muncul: Masalah Redundansi Informasi di SERP
Kutipan langsung dari paten
“Users may receive multiple documents that provide substantially the same information, which may not be useful after the user has already viewed one of them.”
(US 12,013,887 B2 – Background)
Masalah inti yang ingin diselesaikan Google
Google mengidentifikasi tiga masalah utama:
SERP menampilkan dokumen dengan informasi yang saling berulang
Pengguna harus menyaring sendiri mana dokumen yang benar-benar menambah wawasan
Sistem ranking tradisional tidak mempertimbangkan apa yang sudah dibaca pengguna
Dengan kata lain, ranking klasik gagal membedakan “informasi pertama” vs “informasi lanjutan”.
Akibatnya:
Artikel yang “mirip” terus muncul
Konten lanjutan (advanced insight) sering kalah dari konten dasar
Pengalaman eksplorasi pengetahuan menjadi stagnan
Bagaimana Metode Information Gain Scoring Bekerja

Kutipan proses inti dari paten
“Determine an information gain score for each of the documents in the second set.”
(US 12,013,887 B2 – Summary & Fig. 5)
Alur sistem menurut paten (disederhanakan)
Berdasarkan Figure 5 dalam paten, Google menerapkan proses berikut:
Identifikasi dokumen yang sudah dilihat pengguna
“Identify a first set of documents that share a topic provided by a user and have been viewed by the user.”
Identifikasi dokumen lain dengan topik sama tetapi belum dilihat
“Identify a second set of documents that also share the topic that have not been viewed by the user.”
Hitung skor information gain
“Determine an information gain score for each of the documents of the second set.”
Pilih dokumen dengan nilai information gain tertinggi
“Select a new document from the second set based on the information gain scores.”
Sajikan informasi baru kepada pengguna
“Present information extracted from the selected new document to the user.”
Apa yang Dinilai dalam Information Gain?
Berdasarkan deskripsi paten, information gain dipengaruhi oleh:
Seberapa banyak informasi unik dibanding dokumen sebelumnya
Perbedaan konteks, sudut pandang, atau detail
Minimnya overlap semantik dengan konten yang sudah dikonsumsi
Relevansi lanjutan terhadap topik yang sama
Artinya:
Dua artikel bisa sama-sama “relevan”, tetapi hanya satu yang menambah pengetahuan pengguna.
Implikasi Besar untuk SEO: Ranking Bukan Lagi Tentang “Mirip”, tapi “Melanjutkan”
Kutipan penting dari paten
“Information gain may be used to determine which document provides new or additional information relative to previously presented documents.”
(US 12,013,887 B2 – Description)
Ini adalah fondasi ranking berbasis progresi pengetahuan, bukan sekadar kecocokan query.
Apa yang SEO Bisa Tingkatkan dari Perspektif Information Gain
1. Jangan Menulis Ulang Informasi yang Sama
Artikel dengan struktur, heading, dan poin identik memiliki information gain rendah, meskipun:
Lebih panjang
Lebih “SEO-friendly”
Lebih banyak keyword
Solusi:
Hindari “copy semantic structure” dari ranking page lain
Bangun sudut pandang baru, bukan versi lain dari outline yang sama
2. Bangun Konten Berbasis Knowledge Progression
Google kini mengasumsikan:
User sudah membaca konten sebelumnya
User ingin lanjutan, bukan pengulangan
Terapkan:
Beginner → Intermediate → Advanced content
“Apa yang belum dibahas oleh artikel lain?”
Contoh:
Artikel lain menjawab apa itu X
Artikel Anda menjawab mengapa X gagal, kapan X tidak relevan, bagaimana X berevolusi
3. Tingkatkan Document-to-Document Differentiation
Information gain tidak dinilai secara absolut, tetapi relatif terhadap dokumen lain.
Optimasi yang relevan:
Tambahkan atribut baru dari entity yang sama
Bahas edge cases, bukan use case umum
Gunakan contextual expansion, bukan keyword expansion
4. Gunakan Topical Map, Bukan Artikel Tunggal
Paten ini selaras dengan konsep:
topical authority, semantic content network, document sequence optimization (Jika anda bingung tentang jargon ini, saya akan buat artkel tentangnya)
Strategi ideal:
Setiap artikel menjawab subset pengetahuan
Tidak semua artikel harus “lengkap”
Beberapa artikel hanya bertugas menambah satu lapisan informasi
Kesimpulan: Information Gain = Masa Depan Ranking Berbasis Pengetahuan
Google sedang menggeser ranking dari “dokumen terbaik” menjadi “dokumen yang paling berguna pada tahap tertentu”.
Paten Information Gain menunjukkan bahwa:
Relevansi tanpa kebaruan tidak cukup
Redundansi adalah sinyal negatif
Konten yang “melanjutkan pemahaman” memiliki nilai lebih tinggi
Bagi SEO:
Ranking masa depan dimenangkan oleh konten yang tidak bisa digantikan oleh konten lain.
Link Patent: Contextual Estimation of LInk Informational Gain





