deepseek-7b-math-code-lagrange-optimal

Hermite 補間で最適化された λ によるモデルマージ。

Merge Configuration

Parameter	Value
Method	Hermite interpolation (Phase 2 optimized)
λ	[0.499256, 0.500744]
dtype	torch.float16

Union tokenizer (mergekit-style): vocab size = 100016

θ* = Σ_k λ_k θ_k

The mixing weights λ were optimized by minimizing the Hermite polynomial approximation of the loss function (see Phase 2).

Safetensors

Model size

7B params

Tensor type

F16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

(47)

this model