microsoft
/

renderformer-v1.1-swin-large

model_hub_mixin

pytorch_model_hub_mixin

Model card Files Files and versions

doyleconan commited on May 15, 2025

Commit

99c39bf

·

verified ·

1 Parent(s): f113fe5

Upload 2 files

Files changed (2) hide show

README.md +27 -3
config.json +50 -0

README.md CHANGED Viewed

@@ -1,3 +1,27 @@
----
-license: mit
----

+---
+tags:
+- model_hub_mixin
+- pytorch_model_hub_mixin
+- renderformer
+license: mit
+---
+# RenderFormer: Transformer-based Neural Rendering of Triangle Meshes with Global Illumination</h1>
+This repo contains the weights of **RenderFormer-V1.1-Large**.
+## Quick Start
+Please refer to our [Github Repo](https://github.com/microsoft/renderformer).
+## Citation
+If you find our repository useful, please cite our paper in your work:
+```bibtex
+@inproceedings {zeng2025renderformer,
+    title      = {RenderFormer: Transformer-based Neural Rendering of Triangle Meshes with Global Illumination},
+    author     = {Chong Zeng and Yue Dong and Pieter Peers and Hongzhi Wu and Xin Tong},
+    booktitle  = {ACM SIGGRAPH 2025 Conference Papers},
+    year       = {2025}
+}
+```

config.json ADDED Viewed

	@@ -0,0 +1,50 @@

+{
+  "activation": "swiglu",
+  "bias": false,
+  "dim_feedforward": 4096,
+  "dpt_features": 256,
+  "dpt_out_channels": [
+    256,
+    512,
+    1024,
+    1024
+  ],
+  "dpt_out_layers": [
+    2,
+    5,
+    8,
+    11
+  ],
+  "dropout": 0.0,
+  "include_alpha": false,
+  "latent_dim": 1024,
+  "norm_first": true,
+  "norm_type": "rms_norm",
+  "num_heads": 8,
+  "num_layers": 12,
+  "num_register_tokens": 32,
+  "patch_size": 8,
+  "pe_type": "rope",
+  "qk_norm": true,
+  "rope_double_max_freq": true,
+  "rope_type": "triangle",
+  "texture_channels": 13,
+  "texture_encode_patch_size": 1,
+  "texture_encoder_norm_type": "rms_norm",
+  "turn_to_cam_coord": true,
+  "use_dpt_decoder": true,
+  "use_ldr": false,
+  "use_vn_encoder": true,
+  "vdir_num_freqs": 0,
+  "vdir_pe_type": "nerf",
+  "vertex_pe_num_freqs": 12,
+  "view_indep_qk_norm": true,
+  "view_transformer_ffn_hidden_dim": 4096,
+  "view_transformer_include_self_attn": true,
+  "view_transformer_latent_dim": 1024,
+  "view_transformer_n_heads": 8,
+  "view_transformer_n_layers": 12,
+  "view_transformer_use_swin_attn": true,
+  "vn_encoder_norm_type": "rms_norm",
+  "vn_pe_num_freqs": 6
+}