Bài này tặng riêng cho Tarzan Hoàng Lâm. Mong bạn cho mình và Emmaus được có dịp học hỏi
Sự cần thiết của việc chuẩn chính tả dù xưa như trái đất nhưng vẫn sẽ còn là vấn đề thời sự của bất cứ ngôn ngữ nào trên thế giới. Bởi vì nó là một nét biểu hiện của ngôn ngữ mà ngôn ngữ nào cũng có sự đa dạng, sự tiếp nối, cách tân và bổ sung! Trong cuộc sống bình thường, một từ có thể có nhiều cách phát âm và cách viết khác nhau, điều đó cũng không có gì lạ, nhưng xét về mặt thông tin học thì ngôn ngữ dùng để thông tin trong mỗi quốc gia phải là tiếng phổ thông, được nhiều người chấp nhận nhất. Nét nổi bật nhất đó là vấn đề chuẩn hóa chính tả.
Ở những nước tiên tiến, các hàn lâm viện về ngôn ngữ làm việc có bài bản, họ có nhiều chương trình nghiên cứu kết nối với nhiều tổ chức trong việc chuẩn hóa chính tả. Hàng năm (thậm chí hàng quý!) các tổ chức này đều đưa ra những đề nghị về việc chuẩn hóa. Sau những định kỳ nhất định họ lại xuất bản thành sách để công bố rộng rãi những sự thay đổi ấy trong quần chúng. Ấy vậy nên sự chuẩn hóa chính tả luôn luôn được cập nhật, phản ánh kịp thời những thay đổi về ngôn ngữ của cuộc sống hàng ngày. Những tài liệu này thực sự là công cụ hỗ trợ cần thiết, kịp thời cho các nhà chuyên môn cũng như những người dân thường.
Còn ở Việt Nam thì sao? Từ năm 1966, ngay trong khói lửa chiến tranh, Nhà nước ta cũng đã đặt vấn đề về chuẩn hóa chính tả! Sau ngày hợp nhất hai miền Nam Bắc, vấn đề này lại thêm một lần nữa được xới lên, và từ đó tới nay, các hội nghị về chuẩn chính tả cứ vài năm một lần hết tổ chức ngoài Bắc lại đến trong Nam, nhưng ý kiến của các học giả vẫn “trống đánh xuôi, kèn thổi ngược”, chưa có nhiều điểm chung, vậy nên kết quả vẫn là điều “hãy đợi đấy!”. Vẫn còn nhiều vấn đề tồn đọng, khúc mắc trong chuẩn hóa chính tả tiếng Việt cần phải được giải quyết . Vẫn còn đầy rẫy những sự khác biệt, dị biệt về cách viết một từ hay một thuật ngữ được phơi bày trên các mặt báo, trên các thông báo của các cơ quan Nhà nước và ngay cả trong các từ điển tiếng Việt hay song ngữ Việt – nước ngoài… Khi Internet và Thư viện điện tử đã trở nên một công cụ tìm tin phổ biến thì sự thiếu tính nhất quán trong chính tả gây một trở ngại lớn cho người tìm tin. Mỗi một cá nhân khi sử dụng mạng phải làm lại một thao tác nhỏ, trăm nghìn cá nhân, triệu cá nhân…thì thời gian uổng phí này trở nên quá lớn cần phải được quan tâm!
Thực tế khách quan tồn tại ngoài ý muốn của chúng ta! Điều chỉnh hành động của mình cho phù hợp với thực tế, đó là nhiệm vụ của người làm công tác thông tin hiển thị qua con chữ! Nhận thức được điều này, Thư viện ĐHSPKT đã đưa ra một giải pháp tình thế. Với giải pháp này chúng tôi có thể hỗ trợ độc giả tiết kiệm được thời gian tìm tin trên cơ sở dữ liệu (CSDL) của Thư viện một cách nhanh chóng và tránh được việc để lọt tin.
Cơ sở để chọn cho việc chuẩn hóa chính tả trong CSDL là: Dựa vào tần suất xuất hiện cao nhất của các từ và các thuật ngữ có trong các từ điển phổ thông và từ điển chuyên ngành cũng như trong các tạp chí có uy tín được xuất bản ở Việt Nam. Đặc biệt với các thuật ngữ khoa học và kỹ thuật có nguồn gốc tiếng nước ngoài có nhiều cách phiên âm và chuyển tự thì chọn cách viết đơn giản và được nhiều người thừa nhận nhất.
Với những từ thông thường chính tả Việt Nam có 2 cách viết đều được thừa nhận như nhau thì chọn một trong hai cách này và mô tả xuyên suốt trong toàn CSDL mặc dù tên sách hay tên bài báo nhiều khi xuất hiện khác nhau:
Ví dụ như: Đã chấp nhận “vật lý” thì sẽ không viết là “vật lí”. Hoàn toàn tương tự sẽ chỉ chấp nhận: “tâm lý”, “ mỹ học”, “quản lý”, “ thanh lý”.
Đối với những thuật ngữ có nguồn gốc nước ngoài có nhiều cách viết khác nhau thì chọn cách được nhiều người thừa nhận:
Ví dụ: Rô-bốt, rô bốt, robot thì chọn robot; mô-đun, mô đun, modune, module… thì chọn cách viết module ; lô-gic, lôgic, lô-gich, logic… thì chọn cách viết logic…mặc dù trong các tài liệu khác nhau có nhiều cách viết khác nhau
Đối với tên tác giả nước ngoài có nhiều cách viết và phiên âm khác nhau thì chọn phương pháp chuẩn hóa tác giả (Authority Name), chọn cách viết mới nhất phù hợp với cách viết được nhiều nước sử dụng. Ví dụ: Sô-Lô-Khốp, SôLôKhốp, Solokhop, Solokhov…thì chọn Solokhov; GócKi, Goocki, Go-Rơ-Ki, Gorky… thì chọn Gorky
Khi những thuật ngữ khoa học xuất hiện trong Luận văn, Đề tài NCKH, Bài báo chuyên luận…các tác giả có 2 cách viết ( đầy đủ và viết tắt), thì chúng tôi mô tả thêm vào cả 2 cách viết này, mặc dù tác giả chỉ chọn cách viết 1 trong 2 cách viết. Ví dụ: PLC (Programable Logic Control). Với những trường hợp, các thuật ngữ khoa học đó, khi thì được các tác giả viết dưới dạng dịch ra Hán-Việt, khi thì được viết dưới dạng nguyên thể các thuật ngữ nước ngoài…chúng tôi cũng chọn phương pháp bổ sung vào biểu ghi đầy đủ cả 2 dạng.
Với cách bổ sung này khi độc giả tìm tin chỉ cần đưa vào công thức tìm kiếm 1 trong 2 dạng này là có thể không bị lọt tin. Ví dụ: Trí tuệ nhân tạo và Natural Inteligent ; Fuzzy Logic và Lý thuyết tập mờ
Người máy và Robot v..v…
Về vấn đề dấu thanh (accent) trong tiếng Việt, chúng tôi chọn cách bỏ dấu kiểu cũ. Bởi cách viết này còn khá phổ biến trong các tài liệu. Ví dụ: lòe ( không viết là loè), hóa ( không viết là hoá), túy ( không viết là tuý)…
Những sự cố gắng trên của chúng tôi cũng chỉ nhằm tạo sự tiện lợi cho độc giả. Bài viết này là thông điệp chúng tôi muốn gởi tới độc giả, mong độc giả “nhập gia phải tùy tục”, đã là độc giả của www.sinhvienconggiao.net thì hãy quan tâm đến những vấn để nhỏ mọn này. Sự quan tâm của bạn sẽ mang lại nhiều lợi ích thiết thực cho bạn!