使用 utf-8 字符的 python str.format 超过 1 个位置

如何解决使用 utf-8 字符的 python str.format 超过 1 个位置

我试图在 python 中打印日文字符，按列对齐。好像日文字符的宽度等于两个空格，所以对齐不起作用。

代码如下：

def print_kanji(s,k):
    print('{:<20}{:<10}{:<10}{:<10}'
        .format(s,k['reading'][0],k['reading'][1],k['kanji']))

# Being 's' some input string and 'k' a map which contains readings in the 3 different japanese alphabets.

我得到的输出如下：

decir               いう        イウ        言う        

pequeño             すくない      スクナイ      少ない       

niño                こども       コドモ       子供        

ya [ha hecho X]     もう        モウ

左侧的列是西班牙语，但这并不重要。重要的是右边的3列没有对齐。我数了一下位置的数量，结果是正确的，即第一个日文列总是 10 个“位置”长，问题是日文字符是 2 个位置宽，而空白只有 1 个。

我还检查了空白（使用日语输入）也有两个位置宽，因此我应该能够通过用日语替换“拉丁”空格（1 个位置宽度）来解决问题。

如何更改 format 用于对齐字符串的字符？

编辑

我发现 str.format 有一个参数是 fill。我试图用日文空白（两个位置宽）替换它，结果更糟。

编辑 2

我已经通过实现这个功能解决了

def get_formatted_kanji(h,k,kn):
    h2 = h + str(' ' * (10 - 2*len(h)))
    k2 = k + str(' ' * (10 - 2*len(h)))
    kn2 = kn + str(' ' * (10 - 2*len(h)))
    return h2 + k2 + kn2

# being h,k and kn the three 'japanese strings' to be formatted in columns

但是，是否有更好的（内置）方法来实现这一目标？

解决方法

在终端中，某些字符占据两列而其他字符占据一列是很常见的。您可以使用带有 unicodedata 的 east_asian_width() Python 模块找出哪些字符是哪些。

以下是如何使用它填充文本的示例：

import unicodedata
table = [
    ('decir','いう','イウ','言う'),('pequeño','すくない','スクナイ','少ない'),('niño','こども','コドモ','子供'),('ya [ha hecho X]','もう','モウ',''),]

WIDTHS = {
    'F': 2,'H': 1,'W': 2,'N': 1,'A': 1,# Not really correct...
    'Na': 1,}

def pad(text,width):
    text_width = 0
    for ch in text:
        width_class = unicodedata.east_asian_width(ch)
        text_width += WIDTHS[width_class]
    if width <= text_width:
        return text
    return text + ' ' * (width - text_width)

for s,reading1,reading2,kanji in table:
    print('{}{}{}{}'.format(
        pad(s,20),pad(reading1,10),pad(reading2,pad(kanji,))

这是它在我的系统 (macOS) 上的外观的屏幕截图：

限制

以上代码不处理 Unicode 组合字符。更完整的实现将执行 Unicode 文本分割，然后计算出每个字素簇的宽度。我敢肯定，有些图书馆可以为您执行此操作。

语言说明

请注意，我不认为“少ない”和“pequeño”这两个词可能是等价的。西班牙语“pequeño”是指某物的大小，“少ない”是指数量。

我认为更有可能

poco：少ない
pequeño: 小さい

您应该能够更改语言格式：

>>> import locale
>>> locale.setlocale(locale.LC_ALL,'ja-JP') # or 'jpn'

使用 utf-8 字符的 python str.format 超过 1 个位置

如何解决使用 utf-8 字符的 python str.format 超过 1 个位置

编辑

编辑 2

解决方法

限制

语言说明

相关推荐