【淘宝集运源码】【2023最新起名源码】【双生源码投掷】tcmalloc源码-皮皮网

【淘宝集运源码】【2023最新起名源码】【双生源码投掷】tcmalloc源码

时间：2024-12-28 13:03:34 编辑：开发android音乐播放器源码来源：三剑指标源码

1.开源项目|高性能内存分配库mimalloc
2.ä¼åmysql å¤å¤§åå centos6
3.在英特尔 CPU 上微调 Stable Diffusion 模型

tcmalloc源码

开源项目|高性能内存分配库mimalloc

mimalloc

开源内存分配库，源码微软研究院年发布，源码旨在提供高性能内存管理解决方案。源码

使用方法如下：

1. 克隆代码库至本地。源码

2. 编译代码。源码

3. 将头文件复制至系统目录，源码淘宝集运源码如：

4. 编译项目时链接mimalloc。源码

尝试直接使用mimalloc，源码无需编译：

配置环境变量。源码

mimalloc特点：

1. 简洁高效，源码核心代码量少于行。源码

2. 性能显著优于其他内存分配库，源码2023最新起名源码如：mi（mimalloc）、源码tc（tcmalloc）、源码je（jemalloc）等。源码

3. 支持多线程。

架构：

mimalloc设计中，每个线程拥有专属堆，线程在分配内存时从各自堆进行。堆中包含多个分段，每个分段对应多个页面，内存分配在页面上进行。

free列表操作代码。双生源码投掷

源码实现：

1. malloc函数实现

2. free函数实现

参考资料：

[1] cnblogs.com/linkwk7/p/1...

[2] github.com/microsoft/mi...

[3] cnblogs.com/linkwk7/p/1...

ä¼åmysql å¤å¤§åå centos6

ä¸ãmysqlçä¼åæè·¯

mysqlçä¼ååä¸ºä¸¤æ¹é¢ï¼

1. æå¡å¨ä½¿ç¨åçä¼å

2. æå¡ä½¿ç¨ä¸çä¼å

äºãmysqlçåºç¡ä¼åæ¥éª¤

1. ç¡¬ä»¶çº§ä¼å

ï¼1ï¼. æå¥½mysqlèªå·±ä½¿ç¨ä¸å°ç©çæå¡å¨

ï¼5ï¼. mysqläº§ççæ¥å¿ä¸æ°æ®åºä¹æ¾å°ä¸åçç£çååºä¸é¢

2. mysqlæ°æ®åºè®¾è®¡ä¼å

ï¼4ï¼. å°½éå°çä½¿ç¨VARCHARï¼TEXTï¼BLOBè¿ä¸ä¸ªåæ®µ

ï¼6ï¼. ä¸è¦æ»¥ç¨ç´¢å¼ï¼å¤§è¡¨ç´¢å¼ï¼å°è¡¨ä¸ç´¢å¼

ï¼7ï¼. è¡¨çè®¾è®¡åçå(ç¬¦å3NF)

3. mysqléç½®åæ°çä¼å

è¿éæ¯mysql5.5çæ¬çéç½®æä»¶

vi my.cnf

[client]

port = #mysqlå®¢æ·ç«¯è¿æ¥æ¶çé»è®¤ç«¯å£

socket = /tmp/mysql.sock #ä¸mysqlæå¡å¨æ¬å°éä¿¡æä½¿ç¨çsocketæä»¶è·¯å¾

default-character-set = utf8 #æå®é»è®¤åç¬¦éä¸ºutf8

[mysql]

default-character-set = utf8 #æå®é»è®¤åç¬¦éä¸ºutf8

[mysqld]

user = mysql

port =

character-set-server = utf8 #è®¾ç½®æå¡å¨ç«¯çåç¬¦ç¼ç

socket = /tmp/mysql.sock

basedir = /application/mysql

datadir = /mysqldata

skip-locking #é¿åMySQLçå¤é¨éå®ï¼åå°åºéå çå¢å¼ºç¨³å®æ§ã

open_files_limit = #MySQLæå¼çæä»¶æè¿°ç¬¦éå¶ï¼é»è®¤æå°;å½open_files_limitæ²¡æè¢«éç½®çæ¶åï¼æ¯è¾max_connections*5åulimit -nçå¼ï¼åªä¸ªå¤§ç¨åªä¸ªï¼å½open_file_limitè¢«éç½®çæ¶åï¼æ¯è¾open_files_limitåmax_connections*5çå¼ï¼åªä¸ªå¤§ç¨åªä¸ªã

table_cache = #ç©çååè¶å¤§,è®¾ç½®å°±è¶å¤§.é»è®¤ä¸º,è°å°-æä½³

external-locking = FALSE #ä½¿ç¨âskip-external-locking MySQLéé¡¹ä»¥é¿åå¤é¨éå®ãè¯¥éé¡¹é»è®¤å¼å¯

join_buffer_size = 6M #èåæ¥è¯¢æä½æè½ä½¿ç¨çç¼å²åºå¤§å°ï¼åsort_buffer_sizeä¸æ ·ï¼è¯¥åæ°å¯¹åºçåéååä¹æ¯æ¯è¿æ¥ç¬äº«ã

thread_concurrency = 8 #è®¾ç½®thread_concurrencyçå¼çæ£ç¡®ä¸å¦, å¯¹mysqlçæ§è½å½±åå¾å¤§, å¨å¤ä¸ªcpu(æå¤æ ¸)çæåµä¸ï¼éè¯¯è®¾ç½®äºthread_concurrencyçå¼, ä¼å¯¼è´mysqlä¸è½ååå©ç¨å¤cpu(æå¤æ ¸), åºç°åä¸æ¶å»åªè½ä¸ä¸ªcpu(ææ ¸)å¨å·¥ä½çæåµãthread_concurrencyåºè®¾ä¸ºCPUæ ¸æ°ç2å. æ¯å¦æä¸ä¸ªåæ ¸çCPU, é£ä¹thread_concurrencyçåºè¯¥ä¸º4; 2ä¸ªåæ ¸çcpu, thread_concurrencyçå¼åºä¸º8ï¼å±éç¹ä¼ååæ°

default_table_type = InnoDB #é»è®¤è¡¨çå¼æä¸ºInnoDB

thread_stack = K #éå®ç¨äºæ¯ä¸ªæ°æ®åºçº¿ç¨çæ å¤§å°ãé»è®¤è®¾ç½®è¶³ä»¥æ»¡è¶³å¤§å¤æ°åºç¨transaction_isolation = READ-COMMITTED #è®¾å®é»è®¤çäºå¡éç¦»çº§å«.å¯ç¨ççº§å«å¦ä¸:

READ-UNCOMMITTED, READ-COMMITTED, REPEATABLE-READ, SERIALIZABLE,1.READ UNCOMMITTED-è¯»æªæäº¤2.READ COMMITTE-è¯»å·²æäº¤3.REPEATABLE READ -å¯éå¤è¯»4.SERIALIZABLE -ä¸²è¡

tmp_table_size = M #tmp_table_size çé»è®¤å¤§å°æ¯ Mãå¦æä¸å¼ ä¸´æ¶è¡¨è¶åºè¯¥å¤§å°ï¼MySQLäº§çä¸ä¸ª The table tbl_name is full å½¢å¼çéè¯¯ï¼å¦æä½ åå¾å¤é«çº§ GROUP BY æ¥è¯¢ï¼å¢å tmp_table_size å¼ã

long_query_time = 1 #è®°å½æ¶é´è¶è¿1ç§çæ¥è¯¢è¯å¥

log_long_format #

log-error = /logs/error.log #å¼å¯mysqléè¯¯æ¥å¿ï¼è¯¥éé¡¹æå®mysqldä¿åéè¯¯æ¥å¿æä»¶çä½ç½®

log-slow-queries = /logs/slow.log #æ¢æ¥è¯¢æ¥å¿æä»¶è·¯å¾

pid-file = /pids/mysql.pid

log-bin = /binlog/mysql-bin #binlogæ¥å¿ä½ç½®ä»¥åbinlogçåç§°

relay-log = /relaylog/relay-bin #relaylogæ¥å¿ä½ç½®ä»¥åç§°

binlog_cache_size = 1M #binlog_cache_size å°±æ¯æ»¡è¶³ä¸¤ç¹çï¼ä¸ä¸ªäºå¡ï¼å¨æ²¡ææäº¤ï¼uncommittedï¼çæ¶åï¼äº§ççæ¥å¿ï¼è®°å½å°Cacheä¸ï¼çå°äºå¡æäº¤ï¼committedï¼éè¦æäº¤çæ¶åï¼åææ¥å¿æä¹åå°ç£çï¼é»è®¤æ¯Kã

max_binlog_cache_size = M #binlogç¼åæå¤§ä½¿ç¨çåå

max_binlog_size = 2M #ä¸ä¸ªbinlogæ¥å¿çå¤§å°

expire_logs_days = 7 #ä¿ç7å¤©çbinlog

bulk_insert_buffer_size = 1M #æ¹éæå¥æ°æ®ç¼åå¤§å°ï¼å¯ä»¥æææé«æå¥æçï¼é»è®¤ä¸º8M

myisam_sort_buffer_size = 1M #MyISAMè¡¨åçååæ¶éæ°æåºæéçç¼å²

myisam_max_sort_file_size = G #MySQLéå»ºç´¢å¼æ¶æåè®¸çæå¤§ä¸´æ¶æä»¶çå¤§å° (å½ REPAIR, ALTER TABLE æè LOAD DATA INFILE). å¦ææä»¶å¤§å°æ¯æ¤å¼æ´å¤§,ç´¢å¼ä¼éè¿é®å¼ç¼å²åå»º(æ´æ¢)

myisam_recover #èªå¨æ£æ¥åä¿®å¤æ²¡æéå½å³éç MyISAM è¡¨

lower_case_table_names = 1 #è®©mysqlä¸åºåå¤§å°å

#slave-skip-errors = , #è¿æ¯éå¡«é¡¹è®©slaveåºè·³è¿åªäºéè¯¯ç»§ç»åæ¥

#replicate-ignore-db=mysql #éå¡«ï¼åæ¥æ¶ååªä¸ªæ°æ®åºä¸åæ¥è®¾ç½®

server-id = 1

innodb_additional_mem_pool_size = 4M #InnoDB åå¨çæ°æ®ç®å½ä¿¡æ¯åå¶å®åé¨æ°æ®ç»æçååæ± å¤§å°ãåºç¨ç¨åºéçè¡¨è¶å¤ï¼ä½ éè¦å¨è¿éåéè¶å¤çååï¼é»è®¤æ¯2M

innodb_buffer_pool_size = M #è¿å¯¹Innodbè¡¨æ¥è¯´éå¸¸éè¦ãInnodbç¸æ¯MyISAMè¡¨å¯¹ç¼å²æ´ä¸ºææãMyISAMå¯ä»¥å¨é» è®¤ç key_buffer_size è®¾ç½®ä¸è¿è¡çå¯ä»¥ï¼ç¶èInnodbå¨é»è®¤ç è®¾ç½®ä¸å´è·èçä¼¼çãç±äºInnodbææ°æ®åç´¢å¼é½ç¼åèµ·æ¥ï¼æ éçç»æä½ç³»ç»å¤ªå¤çååï¼å æ¤å¦æåªéè¦ç¨Innodbçè¯åå¯ä»¥è®¾ç½®å®é«è¾¾ -% çå¯ç¨ååãä¸äºåºç¨äº key_buffer çè§åæ â å¦æä½ çæ°æ®éä¸å¤§ï¼å¹¶ä¸ä¸ä¼æ´å¢ï¼é£ä¹æ éæ innodb_buffer_pool_size è®¾ç½®çå¤ªå¤§äº

innodb_file_io_threads = 4 #æä»¶IOççº¿ç¨æ°ï¼ä¸è¬ä¸º 4

innodb_thread_concurrency = 8 #ä½ çæå¡å¨CPUæå ä¸ªå°±è®¾ç½®ä¸ºå ,å»ºè®®ç¨é»è®¤ä¸è¬ä¸º8

innodb_log_files_in_group = 3 #ä¸ºæé«æ§è½ï¼MySQLå¯ä»¥ä»¥å¾ªç¯æ¹å¼å°æ¥å¿æä»¶åå°å¤ä¸ªæä»¶ãæ¨èè®¾ç½®ä¸º3M

innodb_max_dirty_pages_pct = #Buffer_Poolä¸Dirty_Pageæå çæ°éï¼ç´æ¥å½±åInnoDBçå³éæ¶é´ãåæ° innodb_max_dirty_pages_pctå¯ä»¥ç´æ¥æ§å¶äºDirty_Pageå¨Buffer_Poolä¸æå çæ¯çï¼èä¸å¹¸è¿çæ¯ innodb_max_dirty_pages_pctæ¯å¯ä»¥å¨ææ¹åçãæä»¥ï¼å¨å³éInnoDBä¹ååè°å°ï¼å¼ºå¶æ°æ®åFlushä¸æ®µæ¶é´ï¼åè½å¤å¤§å¤§ç¼©çMySQLå³éçæ¶é´ã

[mysqldump]

quick

max_allowed_packet = M

4. æ¶æä¼å

ï¼1ï¼. åç«¯ç¨memcachedï¼redisçç¼ååææ°æ®åºåå

ï¼2ï¼. æ°æ®åºè¯»ååç¦»ï¼è´è½½åè¡¡

ï¼3ï¼. æ°æ®åºååºåè¡¨

ï¼4ï¼. åå¨å¯éååå¸å¼

5. åæä¼å

6. æ¥è¯¢ä¼åï¼ææå«äººçï¼

. ä½¿ç¨æ¢æ¥è¯¢æ¥å¿å»åç°æ¢æ¥è¯¢ã

. ä½¿ç¨æ§è¡è®¡åå»å¤ææ¥è¯¢æ¯å¦æ£å¸¸è¿è¡ã

. é¿åå¨æ´ä¸ªè¡¨ä¸ä½¿ç¨count(*),å®å¯è½éä½æ´å¼ è¡¨ã

. å¨éå½çæå½¢ä¸ä½¿ç¨GROUP BYèä¸æ¯DISTINCTã

. å¨WHERE, GROUP BYåORDER BYåå¥ä¸ä½¿ç¨æç´¢å¼çåã

. ä¿æç´¢å¼ç®å,ä¸å¨å¤ä¸ªç´¢å¼ä¸åå«åä¸ä¸ªåã

. æ£æ¥ä½¿ç¨SQL_MODE=STRICTçé®é¢ã

. ä¸ºäº é¿åå¨æ´æ°åSELECTï¼ä½¿ç¨INSERT ON DUPLICATE KEYæèINSERT IGNORE ,ä¸è¦ç¨UPDATEå»å®ç°ã

. ä¸è¦ä½¿ç¨ MAX,ä½¿ç¨ç´¢å¼åæ®µåORDER BYåå¥ã

. é¿åä½¿ç¨ORDER BY RAND().

ãå¨WHEREåå¥ä¸ä½¿ç¨UNIONä»£æ¿åæ¥è¯¢ã

ãä½¿ç¨DROP TABLEï¼CREATE TABLE DELETE FROMä»è¡¨ä¸å é¤æææ°æ®ã

ãæå°åçæ°æ®å¨æ¥è¯¢ä½ éè¦çæ°æ®ï¼ä½¿ç¨*æ¶èå¤§éçæ¶é´ã

ãèèæä¹è¿æ¥ï¼èä¸æ¯å¤ä¸ªè¿æ¥ï¼ä»¥åå°å¼éã

ãå¨å¼åç¯å¢ä¸äº§ççéåæ°æ®ä¸ æµè¯çææå¯ççæ¥è¯¢ã

在英特尔 CPU 上微调 Stable Diffusion 模型

扩散模型，一种能够根据文本提示生成逼真图像的能力，显著推动了生成式人工智能的普及。这些模型广泛应用于数据合成和内容创建等领域，Hugging Face Hub 上拥有超过5千个预训练的文生图模型。结合Diffusers库，构建图像生成工作流或实验不同的图像生成流程变得极为简便。

微调扩散模型以满足特定业务需求的图像生成，通常依赖于GPU。然而，这一情况正在发生变化。台服狂风源码英特尔推出了代号为Sapphire Rapids的第四代至强CPU，其中包含英特尔先进矩阵扩展(AMX)，专门用于加速深度学习工作负载。在之前的博文中，我们已经展示了AMX的优势，包括微调NLP transformer模型、对NLP transformer模型进行推理以及对Stable Diffusion模型进行推理。

本文将展示如何在英特尔第四代至强CPU集群上微调Stable Diffusion模型。我们采用文本逆向(Textual Inversion)技术进行微调，仅需少量训练样本即可有效调整模型。使用5个样本即可实现。罗源码头收费

配置集群时，我们利用英特尔开发者云提供的服务器。这些服务器配置了英特尔第四代至强CPU，每颗CPU包含个物理核和个线程。通过nodefile文件，我们管理了服务器IP地址，其中第一行指为主服务器。

分布式训练要求主节点与其他节点之间实现无密码SSH通信。设置无密码SSH，参考相关文章步骤操作。

搭建运行环境并安装所需软件，包括英特尔优化库如oneCCL和Intel Extension for PyTorch(IPEX)，以利用Sapphire Rapids的硬件加速功能。此外，我们安装了高性能内存分配库libtcmalloc及其软件依赖项gperftools。

在每个节点上，我们克隆diffusers代码库并进行源码安装。对diffusers/examples/textual_inversion中的微调脚本进行优化，利用IPEX对U-Net和变分自编码器(VAE)模型进行推理优化。

下载训练图像，确保在所有节点上的目录路径一致。微调任务启动后，加速器会自动在节点间建立分布式的训练。

配置微调环境时，使用accelerate库简化分布式训练。在每个节点上运行acclerate config并回答问题。设置环境变量，确保所有节点间的通信。

启动微调，使用mpirun在nodefile列出的节点间建立分布式通信。运行命令训练步，耗时约5分钟。训练过程中的集群状态显示在截图中。

分布式训练中可能出现的错误通常包括单节点配置错误，如依赖项缺失或图像位置不同。登录各节点并本地训练可快速定位问题。如果所有节点的训练均成功启动，检查nodefile、环境和mpirun命令。

微调模型后，直接使用diffusers的pipeline加载模型进行图像生成。进一步使用Optimum Intel和OpenVINO对模型进行推理优化。优化后，仅用单颗CPU即可在不到5秒内生成图像。

加载优化后的模型，生成5张不同图像并保存。生成的图像显示模型仅用5张图像就能识别dicoo戴眼镜。对模型进行更多微调，如步，可获得更佳效果。

借助Hugging Face与英特尔的合作，现在能够利用至强CPU服务器生成符合业务需求的高质量图像。CPU不仅比GPU等专用硬件更便宜且易得，还能轻松执行其他任务如Web服务器、数据库等，成为IT基础设施的多功能灵活选择。

入门资源包括：

如有任何疑问或反馈，请访问Hugging Face论坛留言。

【淘宝集运源码】【2023最新起名源码】【双生源码投掷】tcmalloc源码

热点资讯