gitee/voerka-i18n

Fork 0

Go to file

wxzhang 7494bad78b 更新tools

2022-03-14 18:16:09 +08:00

packages

更新tools

2022-03-14 18:16:09 +08:00

test

更新tools

2022-03-14 18:16:09 +08:00

.gitignore

update

2022-03-04 18:38:38 +08:00

jest.config.js

update

2022-03-01 17:48:21 +08:00

package.json

update

2022-03-05 17:59:15 +08:00

pnpm-lock.yaml

更新tools

2022-03-14 18:16:09 +08:00

pnpm-workspace.yaml

init monorepo

2022-03-03 21:56:14 +08:00

readme.md

更新使用文档

2022-03-04 22:17:05 +08:00

readme.md

前言

基于javascript的国际化方案很多，比较有名的有fbt、i18next、react-i18next、vue-i18n、react-intl等等，每一种解决方案均有大量的用户。为什么还要再造一个轮子？好吧，再造轮子的理由不外乎不满足于现有方案，总想着现有方案的种种不足之处，然后就撸起袖子想造一个轮子，也不想想自己什么水平。

哪么到底是对现有解决方案有什么不满？最主要有三点：

大部份均为要翻译的文本信息指定一个key，然后在源码文件中使用形如$t("message.login")之类的方式，然后在翻译时将之转换成最终的文本信息。此方式最大的问题是，在源码中必须人为地指定每一个key，在中文语境中，想为每一句中文均配套想一句符合语义的英文key是比较麻烦的，也很不直观。我希望在源文件中就直接使用中文，如t("中华人民共和国万岁")，然后国际化框架应该能自动处理后续的一系列麻烦。
要能够比较友好地支持多包monorepo场景下的国际化协作，当主程序切换语言时，其他包或库也可以自动切换，并且在开发上每个包或库均可以独立地进行开发，集成到主程序时能无缝集成。这点在现有方案上没有找到比较理想的解决方案。
大部份国际化框架均将中文视为二等公民，大部份情况下您应该采用英文作为第一语言，虽然这不是太大的问题，但是既然要再造一个轮子，为什么不将中文提升到一等公民呢。

当然，在使用方式上要尽可能简洁，便

基于此

安装

VoerkaI18n国际化框架是一个开源多包工程，主要由以下几个包组成：

@voerkai18/runtime

必须的运行时，安装到运行依赖dependencies中

npm install --save @voerkai18/runtime
yarn add @voerkai18/runtime
pnpm add @voerkai18/runtime

@voerkai18/tools

包含文本提取/编译等命行工具，应该安装到开发依赖devDependencies中

npm install --save-dev @voerkai18/tools
yarn add -D @voerkai18/tools
pnpm add -D @voerkai18/tools

@voerkai18/formatters

可选的，一些额外的格式化器，可以按需进行安装到dependencies中

快速入门

本节以标准的Nodejs应用程序为例，简要介绍VoerkaI18n国际化框架的基本使用。其他vue或react应用的使用也基本相同。

myapp
  |--package.json
  |--index.js

第一步：使用翻译函数

在源码文件中直接使用t翻译函数对要翻译文本信息进行封装，简单而粗暴。

// index.js
    
console.log(t("中华人民共和国万岁"))
console.log(t("中华人民共和国成立于{}",1949))

t翻译函数是在哪里声明的？先卖个关子，后续揭晓。

第二步：提取要翻译的内容

接下来我们使用voerkai18n extract命令来自动扫描工程源码文件中的需要的翻译的文本信息。

myapp>voerkai18n extract --languages cn,en,de,jp  --default cn --active cn

以上命令代表：

扫描当前文件夹下所有源码文件
计划支持cn、en、de、jp四种语言
默认语言是中文。（指在源码文件中我们直接使用中文，好象其他方案大部份均要求采用英文）
激活语言是中文（即默认切换到中文）

执行voerkai18n extract命令后，就会在myapp/languages通过生成translates/default.json文件，该文件就是需要进行翻译的文本信息，形式如下：

{
    "中华人民共和国万岁":{
        "en":"<在此编写对应的英文翻译内容>",
        "de":"<在此编写对应的德文翻译内容>"
        "jp":"<在此编写对应的日文翻译内容>",
        "$files":["index.js"]    // 记录了该信息是从哪几个文件中提取的
    },
	"中华人民共和国成立于{}":{
        "en":"<在此编写对应的英文翻译内容>",
        "de":"<在此编写对应的德文翻译内容>"
        "jp":"<在此编写对应的日文翻译内容>",
        "$files":["index.js"]
    }
}

最后文件结构如下：

myapp
  |-- languages
    |-- settings.js                  // 语言配置文件
    |-- translates                   // 此文件夹是所有需要翻译的内容
      |-- default.json
  |-- package.json
  |-- index.js

**注：**当我们修改了源文件后，可以多次执行voerkai18n extract命令，该命令会自动同步合并已翻译的内容，不会导致进行了一半的翻译内容丢失，可以放心执行。

第三步：编码语言包

当我们完成myapp/languages/translates下的所有JSON语言文件的翻译后（如果配置了名称空间后，每一个名称空间会对应生成一个文件，详见后续名称空间介绍），接下来需要对翻译后的文件进行编译。

myapp> voerkai18n compile

compile命令根据myapp/languages/translates/*.json和myapp/languages/settings.js文件编译生成以下文件：

  |-- languages
    |-- settings.js                  // 语言配置文件
    |-- idMap.js                     // 文本信息id映射表
    |-- index.js                     // 包含该应用作用域下的翻译函数等
    |-- cn.js                        // 语言包
    |-- en.js
    |-- jp.js
    |-- de.js
    |-- translates                   // 此文件夹是所有需要翻译的内容
      |-- default.json
  |-- package.json
  |-- index.js

第四步：导入翻译函数

第一步中我们在源文件中直接使用了t翻译函数包装要翻译的文本信息，该t翻译函数就是在编译环节自动生成并声明在myapp/languages/index.js中的。

import { t } from "./languages"

是myapp/languages/index.js文件导出的翻译函数，但是现在myapp/languages还不存在，后续会使用工具自动生成。

指南

翻译函数

默认提供翻译函数t用来进行翻译。


// 从当前语言包文件夹index.js中导入翻译函数
import { t } from "<myapp>/languages"

t("中华人民共和国")

// 位置插值变量
t("中华人民共和国{}","万岁")
t("中华人民共和国成立于{}年，首都{}",1949,"北京")
// 当仅有两个参数且第2个参数是[]类型时，自动展开第一个参数进行位置插值
t("中华人民共和国成立于{year}年，首都{capital}",[1949,"北京"]) 

、
// 当仅有两个参数且第2个参数是{}类型时，启用字典插值变量
t("中华人民共和国成立于{year}年，首都{capital}",{year:1949,capital:"北京"})

// 插值变量可以是同步函数，在进行插值时调用。
t("中华人民共和国成立于{year}年，首都{capital}",()=>1949,"北京")

// 对插值变量启用格式化器
t("中华人民共和国成立于{date | year}年",{date:new Date('')})

复数

默认情况下，t函数仅仅处理单数形式的翻译，当翻译文本内容是一个数组时启用复数处理机制。

启用复数处理机制

假设在index.html文件中具有一个翻译内容

    t("我{}一辆车")

经过extract命令提取为翻译文件后，如下：

// languages/translates/default.json
{
    "我有{}辆车":{
        "en":"",
        "de":"...." 
    }
}

现在我们要求引入复数处理机制，为不同数量采用不同的翻译，只需要将上述翻译文本更改为数组形式。

{
    "我有{}辆车":{
        "en":["I don't have a car","I have a car","I have two cars","I have {} cars"],
        "en":["I don't have a car","I have a car","I have {} cars"],
        "en":["I don't have a car","I have {} cars"],
        "de":"...." 
    }
}

上例中，只需要在翻译文件中将上述的en:""更改为[<0对应的复数文本>,<1对应的复数文本>,...,<n对应的复数文本>]形式代表启动复数机制.

可以灵活地为每一个数字(0、1、2、...、n)对应的复数形式进行翻译
数量数字大于数组长度，则总是取最后一个复数形式
复数形式的文本同样机制位置插值和变量插值。

对应的翻译函数

启用复数处理机制后，在t函数按如下方式进行处理。

不存在插值变量且t函数的第2个参数是数字


t("我有一辆车",0)  // ==   "I don't have a car"
t("我有一辆车",1)  // ==   "I have a car"
t("我有一辆车",2)  // ==   "I have two cars"
t("我有一辆车",100)  // == "I have 100 cars"

存在插值变量且t函数的第2个参数是数字

就中文而言，上述没有指定插值变量是比较别扭的，一般可以引入一个位置插值变量更加友好。


t("我{}一辆车",0)  // ==   "I don't have a car"
t("我{}一辆车",1)  // ==   "I have a car"
t("我{}一辆车",2)  // ==   "I have two cars"
t("我{}一辆车",100)  // == "I have 100 cars"

复数命名插值变量

当启用复数功能时，t函数需要知道根据哪个变量来决定采用何种复数形式。

t("{}有{}辆车","张三",0)

以上采用位置插值变量时只能处理第一个位置插值复数，当翻译内容存在多个位置插值变量时,因为无法获取哪一个位置变量是数字，因此就不能有效处理。如:

t("{}有{}辆车","张三",0)
t("{}有{}辆车","张三",1)

此种情况下就需要采用命名插值变量来处理。具体的方式是约定当插值字典中存在以$字符开头的变量时，并且值是数字时，根据该变量来引用复数。以下例中，t函数根据$count值来处理复数。

t("{name}有{$count}辆车",{name:"Tom",$count:0})    // == "Tom don't have a car"
t("{name}有{$count}辆车",{name:"Tom",$count:1})    // == "Tom have a car"
t("{name}有{$count}辆车",{name:"Tom",$count:2})    // == "Tom have two cars"
t("{name}有{$count}辆车",{name:"Tom",$count:100})  // == "Tom have 100 cars"

示例

// languages/translates/default.json
{
    "第{}章":{
        en:[
            "Chapter Zero","Chapter One", "Chapter Two", "Chapter Three","Chapter Four",
            "Chapter Five","Chapter Six","Chapter Seven","Chapter Eight","Chapter Nine",
            "Chapter {}"
        ],
        cn:["第零章","第一章", "第二章", "第三章","第四章","第五章","第六章","第七章","第八章","第九章"]
    }
}
// 翻译函数
t("第{}章",0)  // == Chapter Zero
t("第{}章",1)  // == Chapter One
t("第{}章",2)  // == Chapter Two
t("第{}章",3)  // == Chapter Three
t("第{}章",4)  // == Chapter Four
t("第{}章",5)  // == Chapter Five
t("第{}章",6)  // == Chapter Six
t("第{}章",7)  // == Chapter Seven
...
t("第{}章",100)  // == Chapter 100

插值变量格式化

voerka-i18n支持对插值变量进行格式化 {{value | filter}} 过滤器语法类似管道操作符，它的上一个输出作为下一个输入。


new VoerkaI18n({
    formats:{
        Date:{                    // 日期格式
            en:{
                default:(value)=>dayjs(value).format("YYYY/MM/DD"),       
                time:(value)=>dayjs(value).format("HH:hh:mm"),
                // 可以定义多种自定义格式...
            },
            cn:{
                default:(value)=>dayjs(value).format("YYYY年MM月DD日"),       
                time:(value)=>dayjs(value).format("HH:hh:mm"),
                // 可以定义多种自定义格式...
            },
        },
        String:{
            en:{
                firstUpper:(value)=>value[0].toUpperCase()+value.substr(1)         // 首字母大写
            }
        }
    }
})

以上代码定义了：

Date类型的英文和中文的两个格式化函数
String类型变量的firstUpper格式化函数

接下来，在翻译内容中使用。


// languages/translates/default.json
{
    "今天是{date}":{
        en:"Today is {date}",   // 使用默认的格式化器
    },
    "现在是北京时间：{date}":{
        en:"Now is { date | time}" // 使用指定的格式化器time
    },

t("今天是{date}",{date:new Date()})

字典

当翻译内容是一个{}时，启用字典插值模式。

// 源文件
// 假设网络状态取值：0=初始化,1=正在连接，2=已连接,3=正在断开.4=已断开,>4=未知

    t("当前状态:{status}",{status})

// translates/default.json

{
    "当前状态:{status}":{
        cn:{0:"初始化",1:"正在连接"，2:"已连接",3:"正在断开",4:"已断开",unknow:"未知"},
        en:{
            to:"Status:{}",
            vars:{"Init","Connecting","Connected","Disconnecting","Disconnected","unknow"}
        },
        en:"Status : {status | dict({0:"Init",1:"Connecting",2:"Connected",3:"Disconnecting",4:"Disconnected",5:"unknow"})}"
    }
}

异步格式化器

大部分情况下，formatter均应该是一个简单的同步函数。VoerkaI18n也支持采用异步formatter，也就是说formatter函数可以是一个async函数。但是由于t函数是一个普通的同步函数，并且在应用程序中使用翻译时采用异步的意义并不大，比如我们打印到日志。

    console.log(t("用户{ username | friend }没有权限",username))

上述语句中的friend格式化器如果是异步不可行的，但是在某此情况下，我们又的的确确需要异步的格式化器。比如在使用字典时，以下例子中,假设用户职位采用一个字典描述（0-普通员工、1-主管、2-经理、3-总经理）。常规情况下，应该由应用程序自行读取该字典

    const post = await getDict(1)
    console.log(t("您的身份是{ post }",post.name))

    console.log(t("您的身份是{ post | dict }",post))

用异步formatter需要遵循一定的流程约定。

首先定义一个异步formatter

{
    cn:{
        dict:async ()=>{
            return {

            }
        }
    }
}


t(" {value | dict() }",{value:2})

合并第三方库语言


import i18n from "voerka-i18n"
import { t } from "./languages" 
  
t("xxxxx")

VoerkaI18n实例

messages:{
    cn:{
        default:{
            text1:""
        },
        namespace:{
            text1:""
        },
    }
}

一语多译

一语多译指同一句文本在不同的语景下，需要翻译成不同的内容。比如

Languages

JavaScript 63.9%

TypeScript 31.8%

Vue 3%

CSS 0.7%

HTML 0.6%

readme.md Unescape Escape

前言

安装

快速入门

第一步：使用翻译函数

第二步：提取要翻译的内容

第三步：编码语言包

第四步：导入翻译函数

指南

翻译函数

复数

启用复数处理机制

对应的翻译函数

示例

插值变量格式化

字典

异步格式化器

合并第三方库语言

一语多译

readme.md