微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

PostgreSQL学习篇13.1 统计信息的收集

PgStat子进程是Postgresql中专门的统计信息收集器进程。表和索引的行数、块数等统计信息记录在系统表pg_class中,其他的统计信息主要收集在系统表pg_statistic中。

统计信息收集器的配置项:

#------------------------------------------------------------------------------
# RUNTIME STATISTICS
#------------------------------------------------------------------------------

# - Query/Index Statistics Collector -

#track_activities = on  --是否允许跟踪每个session正在执行的sql命令的信息和命令开始的时间。可在pg_stat_activity中看到。
#track_counts = on  --控制是否收集表和索引上访问的统计信息。
#track_io_timing = off     --是否允许统计IO调用时间。开启后可在pg_stat_database和pg_stat_statements中看到。9.2之后的新加参数
#track_functions = none                 # none,pl,all     --是否收集函数调用次数和时间的统计信息。
#track_activity_query_size = 1024       # (change requires restart)  --在pg_stat_activity中query字段最多显示多少字节。
#stats_temp_directory = 'pg_stat_tmp'

sql执行的统计信息输出:
# - Statistics Monitoring -

#log_parser_stats = off
#log_planner_stats = off
#log_executor_stats = off
#log_statement_stats = off


手工收集统计信息:
手工收集统计信息的命令是analyze命令,此命令收集表的统计信息,然后将结果保存在系统表pg_statistic中。
autovacuum守护进程,能自动地分析表,并收集表的统计信息。
analyze的命令格式:
analyze [verbose] [table[(column[,..])]]
verbose:显示处理的进度,以及表的一些统计信息。
table:要分析的表名,如果不指定,则对整个数据库中的所有表作分析。
column:要分析的特定字段的名字认是分析所有字段。
analyze命令会在表上加读锁。

对于大表,analyze只读取表的部分内容一个随机抽样,不读取表的所有内容统计信息只是近似的结果。为了调整所收集的统计信息的准确度,可以增大随机抽样比例,可通过参数default_statistics_target来实现,这个参数可以在session级别设置,可以在列级别设置。
set default_statistics_target to xxx;
alter table tab_name alter column col_name set statistics xxx;
analyze有一个统计项是估计出现在每列的不同值的数目。但因为仅仅抽样部分行,所以这个统计项的估计值有时候会很不准确,为了避免因这个错误导致差的查询计划,可以手工指定这个列有多少个唯一值:alter table tab_name alter column col_name set (n_distinct=xxx;
如果表是有继承关系的其他字表的父表,还可以设置n_distinct_inherited,这样子表会继续使用这个父表的设置值。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐