跳到主要内容

Rime 拼写运算

tags:: #000-📥inbox,

  • why

    • 在某些输入方案中,衍生的编码可以由原本的编码通过推导得到(如简拼、模糊音、容错码等等),拼写运算为这种方案提供了描述产生式规则的能力
    • 相同的音系可以因为正字法的不同而产生不同的输入方案(汉语拼音、注音、双拼等等),拼写运算为这种方案提供了重构正字法的能力
    • 还可以改变回显编码的样式等等
  • what

    • 基本概念
      • 音节表
        • 是输入方案中所有编码的集合
        • 拼音输入方案中,音节是可以穷举的,音节表是固定的集合
        • 形码输入方案中,可以按照一定规则在编码空间内给新词组编码,所以没有固定的音节表
      • 拼写:与一个编码对应的输入码,可能与这个编码不相同
      • 拼写法:输入方案中有效拼写的集合到编码集合的映射,也可以称为「正字法」
      • 拼写运算:以拼写为输入的一元函数,从一个拼写变换得到另一个拼写,并且可以赋予结果附加的属性
      • 投影:以拼写法为输入的一元函数,从一个拼写法变换得到另一个拼写法。通常对拼写法连续执行一组投影操作,每一轮操作中对拼写法里的每个有效拼写做一次拼写运算,从而获得新的有效拼写集合,并且重新建立其与编码集合的映射
    • 拼写运算实现为 Rime 中的算法,从 Rime 配置文件导入一个 YAML 列表,每个字符串定义了一项运算
  • how

    • 转写 Transliteration:将一个字母表中的字符变换为另一个字母表中的字符
    • 变形 Transformation:如果拼写与模式匹配,就进行相应的替换
    • 消除 Erasion:将拼写从有效拼写集合中消除(要求完全匹配,和别的不同)
    • 派生 Derivation:替换并同时包含替换前后的拼写
    • 模糊 Fuzzing:在派生的基础上获得模糊属性,用于构词但是不用于单字
    • 缩略 Abbreviation:在派生的基础上获得缩略属性,在音节切分的时候和通常的拼写作区分
  • how good

  • inbox

  • todo

  • ref.

  • archive.