Apa itu meta charset?

Charset atau set karakter secara lengkap pada dasarnya adalah sekumpulan karakter yang dikenali oleh komputer sama seperti kalkulator dapat mengenali angka. Setiap karakter ini diwakili oleh sebuah angka yang dikenal sebagai titik kode dan ini menciptakan saluran komunikasi untuk pengkodean dan dekodean konten.

Set karakter, oleh karena itu, berisi karakter yang melayani tujuan spesifik atau tertentu. Komputer menyimpan karakter sebagai satu atau lebih byte. Sebagai contoh adalah set karakter ASCII yang merepresentasikan semua karakter bahasa Inggris dan karakter kontrol khusus dengan angka dari 0-127.

Namun, kebanyakan set karakter hanya berfungsi untuk bahasa tertentu dan mengenali karakter terbatas dan ini membuat pengkodean dan enkode menjadi sulit atau tidak mungkin. Namun, di zaman modern, Unicode adalah set karakter yang paling dapat diandalkan dan diterima secara universal karena kemampuannya untuk menerjemahkan kode dan angka dengan mudah.

Anda dapat melihat meta charset di bagian header dari kode html Anda

<meta charset="utf-8>

Bagaimana cara kerjanya?

Meta Charset adalah yang menentukan bagaimana teks ditransmisikan dan disimpan. Data teks ini biasanya dikonversi ke biner terlebih dahulu dan kemudian perlu ada semacam sandi yang menghubungkan karakter dengan ekivalen biner yang benar.

Ketika data ini akhirnya didekode, pengkodean karakter harus diketahui terlebih dahulu atau bisa terjadi komplikasi. Contoh dari ini dapat dilihat di peramban ketika Anda melihat sebuah halaman web. Informasi tentang jenis set karakter yang digunakan berasal dari server atau ditulis langsung oleh pengembang. Sayangnya, ada beragam set karakter dan ini berarti berbagai cara untuk mencocokkan kode biner dengan karakter dan byte.

Untuk pengembang konten dan penulis, memilih set karakter UTF-8 untuk konten Anda berarti Anda dapat menggunakan satu set karakter untuk kebutuhan karakter yang beragam sehingga sangat menyederhanakan hal-hal tanpa perlu melacak dan mengonversi berkali-kali. Ini berarti akan lebih mudah untuk menjelajahi konten Anda tanpa mendapatkan karakter yang membingungkan dan sampah

AddType 'text/html; charset=UTF-8' html

Mengapa ini penting?

Ketika Anda memikirkan fakta bahwa setiap kali teks ditransmisikan, teks tersebut perlu dikodekan dalam sebuah charset tertentu dan didekodekan di sisi lain, pentingnya charset sangat jelas. Ini berarti bahwa tanpa pengkodean karakter yang tepat, browser akan menampilkan teks sampah karena browser tersebut sederhananya tidak mengerti apa yang dimasukkan ke dalamnya dan harus membuat tebakan cepat tanpa informasi yang cukup.

Ini juga penting dalam formulir html karena ketika Anda memasukkan teks ke dalam kotak teks di situs atau platform media sosial, teks tersebut harus dikodekan dengan hati-hati. Jika informasi ini tidak tersedia karena alasan apa pun, pemetaan yang salah dapat menyebabkan kehilangan informasi penting.

Contoh kode Charset

Yang dilakukan oleh set karakter adalah menyediakan kunci untuk membuka dan memecahkan kode yang berlalu antara pengguna dan situs web.

Ini adalah serangkaian pemetaan terstruktur antara byte di komputer dan karakter dalam set karakter. Jika kunci ini hilang, data tampak seperti sampah tertulis. Ini berarti bahwa ketika Anda memasukkan teks melalui keyboard, set karakter menghubungkan karakter yang Anda pilih ke byte tertentu dalam memori komputer, dan kemudian untuk menampilkan teks itu membaca byte kembali menjadi karakter.

Apakah ini faktor peringkat untuk SEO?

Set karakter bukanlah faktor peringkat untuk optimasi mesin pencari. Sebagian besar mesin pencari fokus pada tujuan penting untuk menyampaikan konten yang relevan dan berguna kepada mereka yang mencarinya dan sebagai hasilnya tidak mempertimbangkan faktor-faktor luar lainnya yang tidak berkontribusi pada tujuan tersebut.

Jadi set karakter Anda penting karena bagaimana Anda mentransmisikan informasi tetapi mesin pencari tidak tertarik padanya. Menggunakan set karakter lain selain Utf-8 tidak akan menurunkan peringkat SEO Anda karena sejauh ini tidak masalah pengkodean karakter apa yang Anda gunakan selama mesin pencari dapat memberikan informasi kepada pengguna akhir.

Bagaimana cara menambahkannya jika saya membutuhkannya?

Anda dapat menambahkan set karakter ke situs web Anda dengan menggunakan kode berikut

<?phpheader( Content-Type: text/html; charset=iso-8859-1’)

Agar ini berhasil, Anda harus menyertakan ini dalam PHP yang menyertakan file html Anda. Penting untuk dicatat bahwa ini mungkin tidak berfungsi di semua halaman web karena kode di atas bukanlah fungsi tetapi pernyataan sehingga Anda harus menyertakan html halaman Anda. Ini dengan mempertimbangkan bahwa halaman web php menggunakan set karakter Utf-8 pada headernya.

Berbagai jenis charset

Kebanyakan charset muncul dari produsen individu yang memenuhi kebutuhan klien mereka. Kebanyakan charset tidak kompatibel satu sama lain (dengan beberapa pengecualian). Tiga charset yang paling umum adalah, ASCII (1968), ISO 8859-1 (1987) dan UTF-8 (1996).

ASCII

Charset untuk bahasa Inggris. Berisi 7-bit yang dipetakan ke 128 karakter. Setiap huruf diberi nomor dari 0 hingga 127. Set kode ini cukup terbatas, tetapi menjadi salah satu pelopor memicu penciptaan set karakter untuk setiap bahasa lainnya. Kebanyakan komputer menggunakan kode ASCII untuk merepresentasikan teks.

tabel charset ascii

Unicode

Unicode dibuat untuk menyatukan 135 bahasa modern dan historis di bawah satu standar. Unicode adalah standar dan bukan charset itu sendiri. Per Mei 2019, versi 12.1, Unicode berisi 137,994 karakter termasuk simbol dan emoji. Standar Unicode mendefinisikan UTF-8, UTF-16, dan UTF-32

UTF-8

Sekarang kode dominan di internet. UTF-8 digunakan di 94% situs web. Ini mengkodekan karakter yang paling umum, angka dasar, dan bahasa Inggris dengan 8-bit. UTF-8 menggunakan minimal 1 byte. UTF-8 juga identik dengan ASCII untuk bahasa Inggris. Ini berarti bahwa setiap teks ASCII juga merupakan teks UTF-8.

Contoh kode charset UTF-8

Sumber Gambar

UTF-16

Unicode dengan 16 bit. Meskipun awalnya digunakan dengan sistem seperti Windows dan Java, itu tidak pernah benar-benar populer dengan Linux dan macOS. Saat ini UTF-16 digunakan dengan 0.01% halaman web. UTF-16 menggunakan minimal 2 byte.

Contoh set karakter Unicode UTF-16

Sumber Gambar

UTF-32

Unicode dengan 32 bit. Keuntungan dari UTF-32 adalah bahwa titik-titik Unicode langsung diindeks. Kerugiannya adalah tidak efisien dalam penggunaan ruang karena selalu menggunakan 4 byte. Ini berarti hingga dua kali ukuran UTF-16 dan empat kali dari UTF-8.

Kesimpulan

Jadi apa manfaat SEO dari charset? Meskipun bukan faktor peringkat langsung, Anda perlu menyadari charset Anda. Jika Anda secara tidak sengaja menampilkan 2 standar yang berbeda dalam meta charset Anda atau tidak mengikuti aturan standar dengan benar, maka Anda akan mengalami masalah dekoding, dan konten Anda tidak akan ditampilkan dengan benar. Ini akan berdampak negatif pada SEO Anda.

Jika Anda menerapkan charset Anda dengan benar maka Anda akan membantu mencegah tingginya tingkat pantulan, tidak memberikan alasan bagi orang untuk tidak menautkan ke Anda dan mesin pencari tidak dapat salah menginterpretasikan konten Anda yang akan membantu upaya SEO Anda.