一种基于方块字符的通用编码系统,将各种字符转换为视觉化的"宇宙文字"
B站介绍视频: ▀▛▜▖▝▙▟▌▖▐▀▄█▟▞▀▗▀▙▙▜▄▛▛▟▜▞▛▞▌▜▄▛█▛▌▄▌▗▄
在线翻译器: http://dx3906.world
宇宙语是一个创新的字符编码系统,它将传统的GB18030(兼容原来的GB2312并且支持Unicode)编码转换为由16种不同方块字符组成的视觉化符号。每个原始字符都被编码为5或10个方块字符,形成了一种独特的"外星文字"效果。
- 🎯 通用支持: 完整支持GB18030字符集,包括绝大多数汉字生僻字和Unicode中的各种字符
- 🔧 容错机制: 内置校验系统,支持错误检测
- 🎨 视觉美观: 使用16种不同的方块字符,形成独特的视觉效果
- 🔍 智能解析: 自动识别字符类型(单字节/双字节/双字节/四字节)
- 🛡️ 数据完整性: 每个字符包含校验位,确保编解码准确性
宇宙语使用16种Unicode方块字符,每种对应一个4位二进制值:
▀ → 1100 ▄ → 0011 █ → 1111 ▌ → 1010
▐ → 0101 ▓ → 0000 ▖ → 0010 ▗ → 0001
▘ → 1000 ▙ → 1011 ▚ → 1001 ▛ → 1110
▜ → 1101 ▝ → 0100 ▞ → 0110 ▟ → 0111
- 字符分析: 识别字符类型
- 字节转换: 将字符转换为GB18030字节序列
- 位分组: 将字节序列转换为16位二进制,分成4组(每组4位)
- 方块映射: 每组4位对应一个方块字符
- 校验生成: 计算前4个方块的校验和,生成第5个校验方块
原字符 → [4个内容方块] + [1个校验方块] = 5个方块字符
或
原字符 → [4个内容方块] + [1个校验方块] + [4个内容方块] + [1个校验方块]= 10个方块字符
示例:
- 字符 'A' →
▓▓▝▗▐ - 字符 '中' →
▜▞▜▓█ - 字符 '㐀' →
▘▗▄▚▓▛▛▄▚▗ - 字符 '🥰' →
▚▐▄▓▝▜▞▄▞▜
git clone https://github.com/0x3fffff/cosmic-language.git
cd cosmic-languagefrom cosmic_language import CosmicLanguageCodec
# 创建编解码器实例
codec = CosmicLanguageCodec()
# 编码文本
text = "Hello 世界!"
encoded = codec.encode_text(text)
print(f"原文: {text}")
print(f"宇宙语: {encoded}")
# 解码文本
decoded = codec.decode_text(encoded)
print(f"解码结果: {decoded}")| 原字符 | 类型 | 字节值 | 二进制表示 | 宇宙语编码 |
|---|---|---|---|---|
| A | ASCII | 0x41 | 0000000001000001 | ▓▓▝▗▐ |
| 中 | 汉字 | 0xD6D0 | 1101011011010000 | ▜▞▜▓█ |
| ! | 全角 | 0xA3A1 | 1010001110100001 | ▌▄▌▗▄ |
| 🥰 | emoji | 0x9530D636 | 10010101001100001101011000110110 | ▚▐▄▓▝▜▞▄▞▜ |
- 单字节字符 (TYPE_SINGLE_BYTE = 0): ASCII字符
- 双字节字符 (TYPE_DOUBLE_BYTE = 1): 常用汉字、全角符号等
- 四字节字符 (TYPE_DOUBLE_BYTE = 4): 生僻字、Emoji、扩展字符
校验系统采用XOR异或运算结合奇偶校验:
checksum = 0
for block in four_blocks:
checksum ^= int(block_binary_value, 2)
checksum ^= char_type # 添加类型信息
parity = bin(checksum).count('1') % 2
final_checksum = (checksum & 0x7) | (parity << 3)- 智能起始点检测: 自动寻找有效的解码起始位置
- 错误跳过: 遇到无效字符组时自动跳过并继续解码
- 校验验证: 每个字符组都经过校验验证,确保数据完整性
宇宙语的方块字符在不同字体下呈现出独特的视觉效果:
普通文本: 你好,世界!
宇宙语版: ▀▝▛▄▀▙▌▀▄▟▌▄▌▀▛▀▌▀▓▙▙▜▛▟▛▌▄▌▗▄
- 艺术创作: 将文本转换为独特的视觉艺术形式
- 密码学习: 理解字符编码和校验机制
- 教育工具: 可视化字符编码过程
- 创意设计: 为设计项目添加"外星文字"效果
- 数据隐写: 在方块字符中隐藏信息
- 暂无
本项目基于 MIT 许可证 开源。
- 原创者: 0x3fffff
- 项目灵感: 看到抖音的翻译会将方块字翻译成人物简介的Ai幻觉
如果你觉得这个项目有趣,请给它一个 ⭐️!
我们一起将宇宙语发扬光大,让Ai可以真正翻译方块字符! 🚀✨