1.求讲解安卓游戏的游戏源码游戏源码代码的电子书
2.游戏引擎随笔 0x36:UE5.x Nanite 源码解析之可编程光栅化(下)
3.一文讲解Linux内核——组播路由协议原理
4.源码编辑器如何制作躲避障碍游戏讲解
5.超详细的飞机大战小程序源码讲解(1)
求讲解安卓游戏的代码的电子书
个ASP电子书籍,有入门,讲解讲解教程也有实战电子书,游戏源码游戏源码做成了一个下载目录,讲解讲解教程欢迎大家下载。游戏源码游戏源码《Android应用开发揭秘》源代码推荐
Android Phone驱动
安卓(android)编程入门开发教程笔记
Android核心技术与实例详解源代码推荐
android视频播放器源码
Android开发的讲解讲解教程nps源码讲解十个案例打包下载推荐
Android 开发的QQ程序源代码推荐
个经典的Android开源应用项目(源代码)推荐
Android 移动开发案例精选集锦源代码推荐
《Android游戏编程之从零开始》书籍源码推荐
Android 水果连连看源码
Android界面切换之动画效果全汇总推荐
Android经典源码实例汇总(个)推荐
[腾讯微博Android客户端开发]课程文档及源码
深入浅出Android教程+原码程式--台湾Adrioid专家强烈推荐..推荐
Android示例大全(从培训到工作所有的例子)推荐
Android视录视频示例代码下载
Android通讯录程序源码推荐
《Google+Android开发入门与实战》代码
android十个大案例源码(贪吃蛇源、播放器、游戏源码游戏源码文件浏览器、讲解讲解教程浏览..
(Android)俄罗斯方块游戏项目源代码推荐
Android视频监控源码
完美版的游戏源码游戏源码Android 拼图游戏APK和工程源码
Android电子书阅览器(含源码)
种功能项目android源代码下载推荐
android平台的连连看代码
foursquare android客户端源代码
Android源码(基于Linux内核)推荐
Android无线点菜系统
个Android开发应用案例(源码)推荐
android斗地主程序源代码
Android桌面程序Launcher源码
/data/
Android的小游戏源代码
android源码--小说阅读器源码
Android 条码扫描程序源码
《Android/OPhone开发完全讲义》源代码推荐
android文件管理器源代码
Android 文本阅读器源代码
新浪微博android客户端源码--终结版
基于Android编写的MP3播放器源码(带卡拉OK字幕)..推荐
Android PDF 阅读器源码
Android打地鼠游戏
android 做的小游戏源代码
android拼图 游戏源码
sipdroid(Android SIP client)JAVA源码推荐
《Android移动开发一本就够》源码推荐
Android 浏览器源码
Android 海贼王连连看游戏源码
Google Android SDK开发范例大全源码(第二版)推荐
Android 天气预报加widget源码
腾讯电脑管家是集“杀毒+管理”2合1,系统安全防护于一身,讲解讲解教程自带系统修复引擎的游戏源码游戏源码杀毒软件,可以在杀毒后自动修复系统文件
管家独有的讲解讲解教程二代反病毒引擎,防护查杀更彻底,游戏源码游戏源码清理软件建议使用腾讯电脑管家 --首页全面体检--杀毒--清理垃圾-电脑加速--电脑诊所,讲解讲解教程杀毒清理高效彻底
电脑管家企业平台为您解答。游戏源码游戏源码
腾讯电脑管家企业平台:/c/guanjia/
游戏引擎随笔 0x:UE5.x Nanite 源码解析之可编程光栅化(下)
书接上回。
在展开正题之前,先做必要的铺垫,解释纳尼特(Nanite)技术方案中的Vertex Reuse Batch。纳尼特在软光栅路径实现机制中,将每个Cluster对应一组线程执行软光栅,每ThreadGroup有个线程。在光栅化三角形时访问三角形顶点数据,但顶点索引范围可能覆盖整个Cluster的个顶点,因此需要在光栅化前完成Cluster顶点变换。纳尼特将变换后的顶点存储于Local Shared Memory(LDS)中,进行组内线程同步,确保所有顶点变换完成,光栅化计算时直接访问LDS,实现软光栅高性能。
然而,在使用PDO(Masked)等像素可编程光栅化时,纳尼特遇到了性能问题。启用PDO或Mask时,可能需要读取Texture,内存运行源码根据读取的Texel决定像素光栅化深度或是否被Discard。读取纹理需计算uv坐标,而uv又需同时计算重心坐标,增加指令数量,降低寄存器使用效率,影响Active Warps数量,降低延迟隐藏能力,导致整体性能下降。复杂材质指令进一步加剧问题。
此外,当Cluster包含多种材质时,同一Cluster中的三角形被重复光栅化多次,尤其是材质仅覆盖少数三角形时,大量线程闲置,浪费GPU计算资源。
为解决这些问题,纳尼特引入基于GPU SIMT/SIMD的Vertex Reuse Batch技术。技术思路如下:将每个Material对应的三角形再次分为每个为一组的Batch,每Batch对应一组线程,每个ThreadGroup有个线程,正好对应一个GPU Warp。利用Wave指令共享所有线程中的变换后的顶点数据,无需LDS,减少寄存器数量,增加Warp占用率,提升整体性能。
Vertex Reuse Batch技术的启用条件由Shader中的NANITE_VERT_REUSE_BATCH宏控制。
预处理阶段,纳尼特在离线时构建Vertex Reuse Batch,核心逻辑在NaniteEncode.cpp中的BuildVertReuseBatches函数。通过遍历Material Range,统计唯一顶点数和三角形数,达到顶点去重和优化性能的目标。
最终,溯源码验证数据被写入FPackedCluster,根据材质数量选择直接或通过ClusterPageData存储Batch信息。Batch数据的Pack策略确保数据对齐和高效存储。
理解Vertex Reuse Batch后,再来回顾Rasterizer Binning的数据:RasterizerBinData和RasterizerBinHeaders。在启用Vertex Reuse Batch时,这两者包含的是Batch相关数据,Visible Index实际指的是Batch Index,而Triangle Range则对应Batch的三角形数量。
当Cluster不超过3个材质时,直接从FPackedCluster中的VertReuseBatchInfo成员读取每个材质对应的BatchCount。有了BatchCount,即可遍历所有Batch获取对应的三角形数量。在Binning阶段的ExportRasterizerBin函数中,根据启用Vertex Reuse Batch的条件调整BatchCount,表示一个Cluster对应一个Batch。
接下来,遍历所有Batch并将其对应的Cluster Index、Triangle Range依次写入到RasterizerBinData Buffer中。启用Vertex Reuse Batch时,通过DecodeVertReuseBatchInfo函数获取Batch对应的三角形数量。对于不超过3个材质的Cluster,DecodeVertReuseBatchInfo直接从Cluster的VertReuseBatchInfo中Unpack出Batch数据,否则从ClusterPageData中根据Batch Offset读取数据。
在Binning阶段的AllocateRasterizerBinCluster中,还会填充Indirect Argument Buffer,将当前Cluster的Batch Count累加,用于硬件光栅化Indirect Draw的Instance参数以及软件光栅化Indirect Dispatch的ThreadGroup参数。这标志着接下来的光栅化Pass中,每个Instance和ThreadGroup对应一个Batch,以Batch为光栅化基本单位。
终于来到了正题:光栅化。本文主要解析启用Vertex Reuse Batch时的软光栅源码,硬件光栅化与之差异不大,授权彩虹源码此处略过。此外,本文重点解析启用Vertex Reuse Batch时的光栅化源码,对于未启用部分,除可编程光栅化外,与原有固定光栅化版本差异不大,不再详细解释。
CPU端针对硬/软光栅路径的Pass,分别遍历所有Raster Bin进行Indirect Draw/Dispatch。由于Binning阶段GPU中已准备好Draw/Dispatch参数,因此在Indirect Draw/Dispatch时只需设置每个Raster Bin对应的Argument Offset即可。
由于可编程光栅化与材质耦合,导致每个Raster Bin对应的Shader不同,因此每个Raster Bin都需要设置各自的PSO。对于不使用可编程光栅化的Nanite Cluster,即固定光栅化,为不降低原有性能,在Shader中通过两个宏隔绝可编程和固定光栅化的执行路径。
此外,Shader中还包括NANITE_VERT_REUSE_BATCH宏,实现软/硬光栅路径、Compute Pipeline、Graphics Pipeline、Mesh Shader、Primitive Shader与材质结合生成对应的Permutation。这部分代码冗长繁琐,不再详细列出讲解,建议自行阅读源码。
GPU端软光栅入口函数依旧是MicropolyRasterize,线程组数量则根据是否启用Vertex Reuse Batch决定。
首先判断是否使用Rasterizer Binning渲染标记,启用时根据VisibleIndex从Binning阶段生成的RasterizerBinHeaders和RasterizerBinData Buffer中获取对应的Cluster Index和光栅化三角形的起始范围。当启用Vertex Reuse Batch,这个范围是passenger源码分析Batch而非Cluster对应的范围。
在软光栅中,每线程计算任务分为三步。第一步利用Wave指令共享所有线程中的Vertex Attribute,线程数设置为Warp的Size,目前为,每个Lane变换一个顶点,最多变换个顶点。由于三角形往往共用顶点,直接根据LaneID访问顶点可能重复,为确保每个Warp中的每个Lane处理唯一的顶点,需要去重并返回当前Lane需要处理的唯一顶点索引,通过DeduplicateVertIndexes函数实现。同时返回当前Lane对应的三角形顶点索引,用于三角形设置和光栅化步骤。
获得唯一顶点索引后,进行三角形设置。这里代码与之前基本一致,只是写成模板函数,将Sub Pixel放大倍数SubpixelSamples和是否背面剔除bBackFaceCull作为模板参数,通过使用HLSL 语法实现。
最后是光栅化三角形写入像素。在Virtual Shadow Map等支持Nanite的场景下,定义模板结构TNaniteWritePixel来实现不同应用环境下Nanite光栅化Pipeline的细微差异。
在ENABLE_EARLY_Z_TEST宏定义时,调用EarlyDepthTest函数提前剔除像素,减少后续重心坐标计算开销。当启用NANITE_PIXEL_PROGRAMMABLE宏时,可以使用此机制提前剔除像素。
最后重点解析前面提到的DeduplicateVertIndexes函数。
DeduplicateVertIndexes函数给每个Lane返回唯一的顶点索引,同时给当前Lane分配三角形顶点索引以及去重后的顶点数量。
首先通过DecodeTriangleIndices获取Cluster Local的三角形顶点索引,启用Cluster约束时获取所有Lane中最小的顶点索引,即顶点基索引。将当前三角形顶点索引(Cluster Local)减去顶点基索引,得到相对顶点基索引的局部顶点索引。
接下来生成顶点标志位集合。遍历三角形三个顶点,将局部顶点索引按顺序设置到对应位,表示哪些顶点已被使用。每个标志位是顶点的索引,并在已使用的顶点位置处设置为1。使用uint2数据类型,最多表示个顶点位。
考虑Cluster最多有个顶点,为何使用位uint2来保存Vertex Mask而非位?这是由于Nanite在Build时启用了约束机制(宏NANITE_USE_CONSTRAINED_CLUSTERS),该机制保证了Cluster中的三角形顶点索引与当前最大值之差必然小于(宏CONSTRAINED_CLUSTER_CACHE_SIZE),因此,生成的Triangle Batch第一个索引与当前最大值之差将不小于,并且每个Batch最多有个唯一顶点,顶点索引差的最大值为,仅需2个位数据即可。约束机制确保使用更少数据和计算。
将所有Lane所标记三个顶点的Vertex Mask进行位合并,得到当前Wave所有顶点位掩码。通过FindNthSetBit函数找出当前Lane对应的Mask索引,加上顶点基索引得到当前Lane对应的Cluster Local顶点索引。
接下来获取当前Lane对应的三角形的Wave Local的三个顶点索引,用于后续通过Wave指令访问其他Lane中已经计算完成的顶点属性。通过MaskedBitCount函数根据Vertex Mask以及前面局部顶点索引通过前缀求和得到当前Lane对应的Vertex Wave Local Index。
最后统计Vertex Mask所有位,返回总计有效的顶点数量。
注意FindNthSetBit函数,实现Lane与顶点局部索引(减去顶点基索引)的映射,返回当前Lane对应的Vertex Mask中被设置为1的位索引。如果某位为0,则返回下一个位为1的索引。如果Mask中全部位都设置为1,则实际返回为Lane索引。通过二分法逐渐缩小寻找索引范围,不断更新所在位置,最后返回找到的位置索引。
最后,出于验证目的进行了Vertex Reuse Batch的性能测试。在材质包含WPO、PDO或Mask时关闭Vertex Reuse Batch功能,与开启功能做对比。测试场景为由每颗万个三角形的树木组成的森林,使用Nsight Graphics进行Profiling,得到GPU统计数据如下:
启用Vertex Reuse Batch后,软光栅总计耗时减少了1.毫秒。SM Warp总占用率有一定提升。SM内部工作量分布更加均匀,SM Launch的总Warp数量提升了一倍。长短板Stall略有增加,但由于完全消除了由于LDS同步导致的Barrier Stall,总体性能还是有很大幅度的提升。
至此,Nanite可编程光栅化源码解析讲解完毕。回顾整个解析过程,可以发现UE5团队并未使用什么高深的黑科技,而是依靠引擎开发者强悍的工程实现能力完成的,尤其是在充分利用GPU SIMT/SIMD机制榨干机能的同时,保证了功能与极限性能的实现。这种能力和精神,都很值得我们学习。
一文讲解Linux内核——组播路由协议原理
Linux内核中的组播路由协议原理解析
在计算机网络中,组播是一种高效的数据传输方式,用于点对多点通信。不同于单播的点对点和广播的点对所有点,组播是向特定组发送信息,组内的所有接收者都能接收到。组播通过发送一份数据包,仅在需要的地方复制分发,避免了单播中服务器压力大和网络资源浪费的问题。
组播技术的应用广泛,如音频/视频会议、数据分发、实时数据传输以及网络游戏。音频会议结合IP组播的数据共享,形成了强大且带宽效率高的多媒体系统,适合网络教学。数据分发则让大型企业可以高效地向远程节点推送信息,实时数据传输如点播服务,让大量用户同时接收实时内容成为可能。
组播技术的特点在于节省网络带宽、减轻服务器负担,实现分布式应用的高效。然而,基于UDP的IP组播也存在包传送不可靠等问题。在组播实现技术上,组播体系结构包括主机-路由器的组成员关系协议(如IGMP)和路由器-路由器的组播路由协议,如MOSPF、PIM-SM、PIM-DM等,以及域间组播路由协议如MBGP、MSDP等。
组播地址由特殊的IP地址(.0.0.0~...)构成,其中.0.0.0~.0.0.保留给特定用途,如所有组播成员和路由器。物理层的组播MAC地址也有专用格式。为了确保通信,需要建立IP到MAC的映射,这在Linux内核中是通过特定的协议和机制来实现的。
深入理解Linux内核组播路由协议,对于优化网络性能和提升分布式应用的效率至关重要。欲了解更多内核源码高级知识,可加入开发交流Q群获取资料,参与技术分享。
源码编辑器如何制作躲避障碍游戏讲解
源码编辑器如何制作躲避障碍游戏讲解
躲避障碍游戏是一种非常受欢迎的游戏类型,玩家需要通过躲避障碍物来尽可能地前进。在本篇文章中,我们将介绍如何使用源码编辑器来制作自己的躲避障碍游戏。
步骤一:创建游戏画布
首先,我们需要创建游戏画布。在 HTML 中,我们可以使用
canvas
标签来创建画布,在 JavaScript 中,我们可以使用
getContext()
方法来获取画布的绘图上下文。以下是一个示例代码:
!DOCTYPE html
html
head
title躲避障碍游戏/title
/head
body
canvas id=\game-canvas\ width=\\ height=\\gt;/canvas
script
var canvas = document.getElementById('game-canvas');
var ctx = canvas.getContext('2d');
/script
/body
/html
步骤二:创建游戏角色
接下来,我们需要创建游戏角色。在躲避障碍游戏中,玩家通常会控制一个角色来躲避障碍物。以下是一个简单的示例代码,用于创建游戏角色:
var player = {
x: ,
y: ,
width: ,
height: ,
speed: 5,
color: '#ff'
};
在这个示例代码中,我们创建了一个名为 player 的对象,该对象具有 x 和 y 坐标,宽度和高度,速度和颜色属性。
步骤三:创建障碍物
接下来,我们需要创建障碍物。在躲避障碍游戏中,玩家需要躲避障碍物以避免游戏结束。以下是一个简单的示例代码,用于创建障碍物:
var obstacles = [
{
x: ,
y: ,
width: ,
height: ,
color: '#ff'
},
{
x: ,
y: ,
width: ,
height: ,
color: '#ff'
}
];
在这个示例代码中,我们创建了一个名为 obstacles 的数组,该数组包含两个具有 x 和 y 坐标,宽度和高度,颜色属性的对象。这些对象将在游戏中作为障碍物出现。
步骤四:绘制游戏画面
现在我们已经创建了游戏角色和障碍物,接下来我们需要绘制游戏画面。下面是一个示例代码,用于绘制游戏画面:
function draw() {
// 清除画布
ctx.clearRect(0, 0, canvas.width, canvas.height);
// 绘制角色
ctx.fillStyle = player.color;
ctx.fillRect(player.x, player.y, player.width, player.height);
// 绘制障碍物
obstacles.forEach(function(obstacle) {
ctx.fillStyle = obstacle.color;
ctx.fillRect(obstacle.x, obstacle.y, obstacle.width, obstacle.height);
});
}
在这个示例代码中,我们使用
clearRect()
方法清除画布,然后使用
fillRect()
方法绘制游戏角色和障碍物。
步骤五:实现游戏逻辑
最后,我们需要实现游戏逻辑。在躲避障碍游戏中,玩家需要通过控制角色来躲避障碍物。以下是一个简单的示例代码,用于实现游戏逻辑:
function update() {
// 移动角色
if ( in keysDown) { // 按下了上箭头
player.y -= player.speed;
}
if ( in keysDown) { // 按下了下箭头
player.y += player.speed;
}
if ( in keysDown) { // 按下了左箭头
player.x -= player.speed;
}
if ( in keysDown) { // 按下了右箭头
player.x += player.speed;
}
// 检测碰撞
obstacles.forEach(function(obstacle) {
if (player.x < obstacle.x + obstacle.width
location.reload();
}
});
}
在这个示例代码中,我们检测玩家是否与障碍物相撞,如果相撞,则提示玩家游戏结束,并重新加载游戏。
结论
现在,我们已经学会了如何使用源码编辑器来制作自己的躲避障碍游戏。希望这篇文章能对你有所帮助!
超详细的飞机大战小程序源码讲解(1)
本次讲解主要以代码的形式,需要读者有一定的编码能力,内容总共分为六个章节,其他章节链接如下: (2): 花儿:超详细的飞机大战小程序源码讲解(2) (3): 花儿:超详细的飞机大战小程序源码讲解(3) (4): 花儿:超详细的飞机大战小程序源码讲解(4) (5): 花儿:超详细的飞机大战小程序源码讲解(5) (6): 花儿:超详细的飞机大战小程序源码讲解(6)一、Javerscript基础
1.1 export default 1.2 let instance 1.3 const 1.4 箭头函数 1.5 this 函数优先级二、飞机大战小程序源码获取
微信开发者工具网址:/miniprogram/dev/devtools/devtools.html 在工具页面选择下载版本,一般选稳定版即可。 安装完成后双击打开,界面如下。点击小游戏,选择飞机大战小游戏,用模拟器跑出来如图也可以在手机上运行。三、代码框架图
## quickstart ## 源码目录介绍 ./js ├── base // 定义游戏开发基础类 │ ├── animatoin.js // 帧动画的简易实现 │ ├── pool.js // 对象池的简易实现 │ └── sprite.js // 游戏基本元素精灵类 ├── libs │ ├── symbol.js // ES6 Symbol简易兼容 │ └── weapp-adapter.js // 小游戏适配器 ├── npc │ └── enemy.js // 敌机类 ├── player │ ├── bullet.js // 子弹类 │ └── index.js // 玩家类 ├── runtime │ ├── background.js // 背景类 │ ├── gameinfo.js // 用于展示分数和结算界面 │ └── music.js // 全局音效管理器 ├── databus.js // 管控游戏状态 └── main.js // 游戏入口主函数 类的继承关系如下: 子类:BackGround -> 父类:Sprite 子类:Player -> 父类:Sprite 子类:Bullet -> 父类:Sprite 子类:Enemy -> 父类:Animation -> 父类:Sprite