如何解决有没有办法将符文打印为单个字符? 代码问题在下面继续如何在 C 中做到这一点?我想到的一个例子:如果你能指出来,我会非常高兴!谢谢!外部链接以一串宽字符的形式存储在堆栈中关于宽字符和 Unicode
程序的目的:符文密码
最终编辑:
我现在(感谢极端了不起的人提供的非常有用答案)完成了我一直在从事的项目;并且 - 对于未来的读者,我还提供了完整的代码。
再一次,如果没有我从下面的人那里得到的所有帮助,这不可能成为可能,感谢他们 - 再次!
原始代码on GitHub
代码
(稍微缩短)
#include <stdio.h>
#include <locale.h>
#include <wchar.h>
#define UNICODE_BLOCK_START 0x16A0
#define UUICODE_BLOCK_END 0x16F1
int main(){
setlocale(LC_ALL,"");
wchar_t SUBALPHA[]=L"ᛠᚣᚫᛞᛟᛝᛚᛗᛖᛒᛏᛋᛉᛈᛇᛂᛁᚾᚻᚹᚷᚳᚱᚩᚦᚢ";
wchar_t DATA[]=L"hello";
int lenofData=0;
int i=0;
while(DATA[i]!='\0'){
lenofData++; i++;
}
for(int i=0; i<lenofData; i++) {
printf("DATA[%d]=%lc",i,DATA[i]);
DATA[i]=SUBALPHA[i];
printf(" is now Replaced by %lc\n",DATA[i]);
} printf("%ls",DATA);
return 0;
}
输出:
DATA[0]=h is now Replaced by ᛠ
DATA[1]=e is now Replaced by ᚣ
DATA[2]=l is now Replaced by ᚫ
DATA[3]=l is now Replaced by ᛞ
DATA[4]=o is now Replaced by ᛟ
ᛠᚣᚫᛞᛟ
问题在下面继续
(注意已经解决了,查看接受的答案!)
在 Python3 中很容易打印符文:
for i in range(5794,5855):
print(chr(i))
输出
ᚢ ᚣ (..) ? ➞
如何在 C 中做到这一点?
- 使用变量(char、char 数组[]、int、...)
有没有办法例如将 ᛘᛙᛚᛛᛜᛝᛞ 打印为单个字符?
当我尝试时,它只是打印出关于多字符字符常量 'ᛟ'
的两个警告。
我尝试将它们作为字符数组、“字符串”(例如 char s1 = "ᛟᛒᛓ";)
- 然后打印出 s1 的第一个
(ᛟ)
字符:printf("%c",s1[0]);
现在,这在其他人看来可能是非常错误的。
我想到的一个例子:
将符文打印为“单个字符”:
打印例如'A'
printf("%c",65); // 'A'
我该怎么做,(如果可能)但使用符文?
我也尝试将它的数字值打印到字符,这会导致问号,以及 - 其他“未定义”结果。
由于我不太记得到目前为止我尝试过的所有事情,我会尽力制定这篇文章。
如果有人发现一个非常简单的(也许,对他/她来说——甚至是显而易见的)解决方案(或技巧/解决方法)-
如果你能指出来,我会非常高兴!谢谢!
这已经困扰了我很长时间了,尽管它在 python
中有效 - 如果您只是“打印”它(而不是通过任何变量)但是,例如:c
这有效,但正如我所说,我想做同样的事情,但是,通过变量。 (例如,printf("ᛟ");
然后:char runes[]="ᛋᛟ";)
(或类似的,它不需要是 printf("%c",runes[0]); // to get 'ᛋ' as the output
,也不需要是 char 数组/char 变量)我只是想了解如何 - 执行上述操作,(希望不太难读)
我在 Linux 上使用 GCC。
外部链接
Viewing Runes - At Unix&Linux SE
解决方法
要保存 8 位范围之外的字符,您需要一个 wchar_t
(不一定是 Unicode)。尽管 wchar_t
是基本的 C 类型,但您需要 #include <wchar.h>
才能使用它,并使用字符串和 I/O 函数的宽字符版本(例如下面显示的 putwc
)。
您还需要确保您已激活支持宽字符的区域设置,该区域设置应与终端模拟器使用的区域设置相同(如果您正在写入终端)。通常,这将是默认语言环境,使用字符串 ""
选择。
这里有一个简单的等效于您的 Python 代码:
#include <locale.h>
#include <stdio.h>
#include <wchar.h>
int main(void) {
setlocale(LC_ALL,"");
/* As indicated in a comment,I should have checked the
* return value from `putwc`; if it returns EOF and errno
* is set to EILSEQ,then the current locale can't handle
* runic characters.
*/
for (wchar_t wc = 5794; wc < 5855; ++wc)
putwc(wc,stdout);
putwc(L'\n',stdout);
return 0;
}
(在 ideone 直播。)
,以一串(宽)字符的形式存储在堆栈中
如果你想将你的符文 (wchar_t) 添加到一个字符串中,那么你可以通过以下方式进行:
使用 wcsncpy :(对字符过度杀伤,感谢 chqrlie 的注意)
#define UNICODE_BLOCK_START 0x16A0 // see wikipedia link for the start
#define UUICODE_BLOCK_END 0x16F0 // true ending of Runic wide chars
int main(void) {
setlocale(LC_ALL,"");
wchar_t buffer[UUICODE_BLOCK_END - UNICODE_BLOCK_START + sizeof(wchar_t) * 2];
int i = 0;
for (wchar_t wc = UNICODE_BLOCK_START; wc <= UUICODE_BLOCK_END; wc++)
buffer[i++] = wc;
buffer[i] = L'\0';
printf("%ls\n",buffer);
return 0;
}
关于宽字符(和 Unicode)
为了更好地理解什么是 wide char,您必须将其视为一组超出用于字符 2^8 = 256
的原始范围的位集,或者 {{3} }},1 << 8
).
当您只需要打印键盘上的内容时就足够了,但是当您需要打印亚洲字符或其他 unicode 字符时,这已经不够了,这就是创建 left shifting 的原因.您可以在 Unicode standard 上找到更多关于存在的非常不同和奇特的字符及其范围(命名为 unicode 块)的信息,在您的情况下 runic
。
范围 U+16A0..U+16FF - 符文(86 个字符),通用(3 个字符)
注意:您的符文宽字符以 0x16F1 结尾,它略早于 0x16FF(0x16F1 到 0x16FF 未定义)
您可以使用以下函数将宽字符打印为位:
void print_binary(unsigned int number)
{
char buffer[36]; // 32 bits,3 spaces and one \0
unsigned int mask = 0b1000000000000000000000000000;
int i = 0;
while (i++ < 32) {
buffer[i] = '0' + !!(number & (mask >> i));
if (i && !(i % 8))
buffer[i] = ' ';
}
buffer[32] = '\0';
printf("%s\n",buffer);
}
你在循环中调用:
print_binary((unsigned int)wc);
它会让您更好地了解宽字符在机器级别的表示方式:
ᛞ
0000000 0000001 1101101 1100000
注意:您需要注意细节:不要忘记最后的 L'\0'
并且您需要使用 %ls
获得带有 {{1} 的输出}.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。