logo

[Sách mới] Lý thuyết Tin 10 Bài 3 ngắn nhất: Số hóa văn bản (Cánh diều)

Tóm tắt Lý thuyết Tin 10 Bài 3 ngắn nhất: Số hóa văn bản (Cánh diều) theo chương trình Sách mới ngắn gọn nhất. Tổng hợp lý thuyết Tin học 10 trọn bộ chi tiết, đầy đủ.

Bài 3: Số hóa văn bản - Tin học 10 Cánh diều


1. Bảng mã ASCII

Một trong số các quy định đầu tiên còn dùng đến ngày nay là bảng mã ASCII,  ASCII là bộ mã chuẩn của Mỹ để trao đổi thông tin. Mã ASCII của một kí tự là dãy 7 bit, có thể biểu diễn 128 kí tự khác nhau. Ngoài những kí tự in ra màn hình được như ta vẫn hiểu, còn có những “kí tự” không in ra màn hình mà là một tín hiệu để điều khiển máy tính. Người ta gọi chúng là kí tự điều khiển.


2. Bảng mã UNICODE

Bảng mã Unicode được thiết kế với mục đích thống nhất chung việc mã hoá các kí tự cho tất cả các ngôn ngữ khác nhau trên thế giới. Chữ Nôm cổ của nước ta cũng có trong bảng mã này. Với chức năng như vậy, bảng mã Unicode được sử dụng ngày càng phổ biến.

Sách mới Lý thuyết Tin 10 Bài 3 ngắn nhất: Số hóa văn bản (Cánh diều)

3. Mã kí tự, bộ kí tự và mã nhị phân

Con đường đi từ các kí tự cho đến mã nhị phân của nó được chia làm hai bước:

- Bước thứ nhất: Cho tương ứng mỗi kí tự với một mã kí tự duy nhất, là một dãy kỉ số, giống như số căn cước công dân là mã định danh duy nhất của mỗi người

- Bước thứ hai: Chuyển từ mã kí tự thành dãy bit để máy tính xử lí được, gọi là mã hóa. Kết quả bước này là một dãy bit. Đây là mã nhị phân của kí tự.


4. Dữ liệu văn bản và số hóa văn bản

Văn bản thuần chữ

Văn bản thuần chữ chỉ gồm các kí tự gõ nhập từ bàn phím khi soạn thảo văn bản. Văn bản thuần chữ là một dãy các kí tự xếp liên tiếp từ trái sang phải, từ trên xuống dưới.

Dữ liệu văn bản 

Dữ liệu văn bản trong máy tính là một dãy bit biểu diễn các kí tự có kiểu dáng, màu sắc và các thông tin định dạng khác.


5. Kí tự Tiếng Việt trong dữ liệu văn bản

Hiện nay tiêu chuẩn Việt Nam đã thống nhất dùng bảng mã kí tự Unicode.

Bộ gõ tiếng Việt UniKey khá phổ biến hiện nay có công cụ dễ dàng chuyển đổi các văn bản theo tiêu chuẩn cũ sang dùng mã Unicode để phù hợp với tiêu chuẩn mới.

Sách mới Lý thuyết Tin 10 Bài 3 ngắn nhất: Số hóa văn bản (Cánh diều)

>>> Xem toàn bộ: Tóm tắt lý thuyết Tin 10 ngắn gọn Cánh Diều

-----------------------------

Trên đây Toploigiai đã cùng các bạn Tóm tắt Lý thuyết Tin học 10 Bài 3 Cánh diều: Số hóa văn bản theo chương trình Sách mới ngắn gọn nhất. Tổng hợp lý thuyết Tin học 10 trọn bộ chi tiết, đầy đủ. trong bộ SGK Kết nối tri thức theo chương trình sách mới. Chúng tôi hi vọng các bạn đã có kiến thức hữu ích khi đọc bài viết này. Toploigiai đã có đầy đủ các bài soạn cho các môn học trong các bộ sách mới Cánh Diều, Chân trời sáng tạo, Kết nối tri thức. Mời các bạn hãy click ngay vào trang chủ Top lời giải để tham khảo và chuẩn bị bài cho năm học mới nhé. Chúc các bạn học tốt

icon-date
Xuất bản : 23/09/2022 - Cập nhật : 24/09/2022