Spaces:

lynx-analytics
/

lynxkite

Running

App Files Files Community

lynxkite / lynxkite-graph-analytics /src /lynxkite_graph_analytics /pytorch_model_ops.py

darabos

Split build_model() so we can repeat a part.

69610f6 3 months ago

raw

history blame

16.9 kB

	"""Boxes for defining PyTorch models."""

	import copy
	import enum
	import graphlib

	import pydantic
	from lynxkite.core import ops, workspace
	from lynxkite.core.ops import Parameter as P
	import torch
	import torch_geometric as pyg
	import dataclasses
	from . import core

	ENV = "PyTorch model"


	def op(name, **kwargs):
	_op = ops.op(ENV, name, **kwargs)

	def decorator(func):
	_op(func)
	op = func.__op__
	for p in op.inputs.values():
	p.position = "bottom"
	for p in op.outputs.values():
	p.position = "top"
	return func

	return decorator


	def reg(name, inputs=[], outputs=None, params=[]):
	if outputs is None:
	outputs = inputs
	return ops.register_passive_op(
	ENV,
	name,
	inputs=[ops.Input(name=name, position="bottom", type="tensor") for name in inputs],
	outputs=[ops.Output(name=name, position="top", type="tensor") for name in outputs],
	params=params,
	)


	reg("Input: tensor", outputs=["x"], params=[P.basic("name")])
	reg("Input: graph edges", outputs=["edges"])
	reg("Input: sequential", outputs=["y"])

	reg("LSTM", inputs=["x", "h"], outputs=["x", "h"])
	reg(
	"Neural ODE",
	inputs=["x"],
	params=[
	P.basic("relative_tolerance"),
	P.basic("absolute_tolerance"),
	P.options(
	"method",
	[
	"dopri8",
	"dopri5",
	"bosh3",
	"fehlberg2",
	"adaptive_heun",
	"euler",
	"midpoint",
	"rk4",
	"explicit_adams",
	"implicit_adams",
	],
	),
	],
	)


	reg("Attention", inputs=["q", "k", "v"], outputs=["x", "weights"])
	reg("LayerNorm", inputs=["x"])
	reg("Dropout", inputs=["x"], params=[P.basic("p", 0.5)])


	@op("Linear")
	def linear(x, *, output_dim="same"):
	if output_dim == "same":
	oshape = x.shape
	else:
	oshape = tuple(*x.shape[:-1], int(output_dim))
	return Layer(torch.nn.Linear(x.shape, oshape), shape=oshape)


	class ActivationTypes(enum.Enum):
	ReLU = "ReLU"
	Leaky_ReLU = "Leaky ReLU"
	Tanh = "Tanh"
	Mish = "Mish"


	@op("Activation")
	def activation(x, *, type: ActivationTypes = ActivationTypes.ReLU):
	f = getattr(torch.nn.functional, type.name.lower().replace(" ", "_"))
	return Layer(f, shape=x.shape)


	@op("MSE loss")
	def mse_loss(x, y):
	return Layer(torch.nn.functional.mse_loss, shape=[1])


	reg("Softmax", inputs=["x"])
	reg(
	"Graph conv",
	inputs=["x", "edges"],
	outputs=["x"],
	params=[P.options("type", ["GCNConv", "GATConv", "GATv2Conv", "SAGEConv"])],
	)
	reg("Concatenate", inputs=["a", "b"], outputs=["x"])
	reg("Add", inputs=["a", "b"], outputs=["x"])
	reg("Subtract", inputs=["a", "b"], outputs=["x"])
	reg("Multiply", inputs=["a", "b"], outputs=["x"])
	reg("Triplet margin loss", inputs=["x", "x_pos", "x_neg"], outputs=["loss"])
	reg("Cross-entropy loss", inputs=["x", "y"], outputs=["loss"])
	reg(
	"Optimizer",
	inputs=["loss"],
	outputs=[],
	params=[
	P.options(
	"type",
	[
	"AdamW",
	"Adafactor",
	"Adagrad",
	"SGD",
	"Lion",
	"Paged AdamW",
	"Galore AdamW",
	],
	),
	P.basic("lr", 0.001),
	],
	)

	ops.register_passive_op(
	ENV,
	"Repeat",
	inputs=[ops.Input(name="input", position="top", type="tensor")],
	outputs=[ops.Output(name="output", position="bottom", type="tensor")],
	params=[
	ops.Parameter.basic("times", 1, int),
	ops.Parameter.basic("same_weights", False, bool),
	],
	)

	ops.register_passive_op(
	ENV,
	"Recurrent chain",
	inputs=[ops.Input(name="input", position="top", type="tensor")],
	outputs=[ops.Output(name="output", position="bottom", type="tensor")],
	params=[],
	)


	def _to_id(*strings: str) -> str:
	"""Replaces all non-alphanumeric characters with underscores."""
	return "_".join("".join(c if c.isalnum() else "_" for c in s) for s in strings)


	@dataclasses.dataclass
	class TensorRef:
	"""Ops get their inputs like this. They have to return a Layer made for this input."""

	_id: str
	shape: tuple[int, ...]


	@dataclasses.dataclass
	class Layer:
	"""Return this from an op. Must include a module and the shapes of the outputs."""

	module: torch.nn.Module
	shapes: list[tuple[int, ...]] \| None = None # One for each output.
	shape: dataclasses.InitVar[tuple[int, ...] \| None] = None # Convenience for single output.
	# Set by ModelBuilder.
	_origin_id: str \| None = None
	_inputs: list[TensorRef] \| None = None
	_outputs: list[TensorRef] \| None = None

	def __post_init__(self, shape):
	assert not self.shapes or not shape, "Cannot set both shapes and shape."
	if shape:
	self.shapes = [shape]

	def _for_sequential(self):
	inputs = ", ".join(i._id for i in self._inputs)
	outputs = ", ".join(o._id for o in self._outputs)
	return self.module, f"{inputs} -> {outputs}"


	class ColumnSpec(pydantic.BaseModel):
	df: str
	column: str


	class ModelMapping(pydantic.BaseModel):
	map: dict[str, ColumnSpec]


	@dataclasses.dataclass
	class ModelConfig:
	model: torch.nn.Module
	model_inputs: list[str]
	model_outputs: list[str]
	loss_inputs: list[str]
	loss: torch.nn.Module
	optimizer: torch.optim.Optimizer
	source_workspace: str \| None = None
	trained: bool = False

	def _forward(self, inputs: dict[str, torch.Tensor]) -> dict[str, torch.Tensor]:
	model_inputs = [inputs[i] for i in self.model_inputs]
	output = self.model(*model_inputs)
	if not isinstance(output, tuple):
	output = (output,)
	values = {k: v for k, v in zip(self.model_outputs, output)}
	return values

	def inference(self, inputs: dict[str, torch.Tensor]) -> dict[str, torch.Tensor]:
	# TODO: Do multiple batches.
	self.model.eval()
	return self._forward(inputs)

	def train(self, inputs: dict[str, torch.Tensor]) -> float:
	"""Train the model for one epoch. Returns the loss."""
	# TODO: Do multiple batches.
	self.model.train()
	self.optimizer.zero_grad()
	values = self._forward(inputs)
	values.update(inputs)
	loss_inputs = [values[i] for i in self.loss_inputs]
	loss = self.loss(*loss_inputs)
	loss.backward()
	self.optimizer.step()
	return loss.item()

	def copy(self):
	"""Returns a copy of the model."""
	c = dataclasses.replace(self)
	c.model = copy.deepcopy(self.model)
	return c

	def metadata(self):
	return {
	"type": "model",
	"model": {
	"inputs": self.model_inputs,
	"outputs": self.model_outputs,
	"loss_inputs": self.loss_inputs,
	"trained": self.trained,
	},
	}


	def build_model(ws: workspace.Workspace, inputs: dict[str, torch.Tensor]) -> ModelConfig:
	"""Builds the model described in the workspace."""
	builder = ModelBuilder(ws, inputs)
	return builder.build_model()


	class ModelBuilder:
	"""The state shared between methods that are used to build the model."""

	def __init__(self, ws: workspace.Workspace, inputs: dict[str, torch.Tensor]):
	self.catalog = ops.CATALOGS[ENV]
	optimizers = []
	self.nodes = {}
	for node in ws.nodes:
	self.nodes[node.id] = node
	if node.data.title == "Optimizer":
	optimizers.append(node.id)
	assert optimizers, "No optimizer found."
	assert len(optimizers) == 1, f"More than one optimizer found: {optimizers}"
	[self.optimizer] = optimizers
	self.dependencies = {n.id: [] for n in ws.nodes}
	self.in_edges = {}
	self.out_edges = {}
	repeats = []
	for e in ws.edges:
	if self.nodes[e.target].data.title == "Repeat":
	repeats.append(e.target)
	self.dependencies[e.target].append(e.source)
	self.in_edges.setdefault(e.target, {}).setdefault(e.targetHandle, []).append(
	(e.source, e.sourceHandle)
	)
	self.out_edges.setdefault(e.source, {}).setdefault(e.sourceHandle, []).append(
	(e.target, e.targetHandle)
	)
	# Split repeat boxes into start and end, and insert them into the flow.
	# TODO: Think about recursive repeats.
	for repeat in repeats:
	start_id = f"START {repeat}"
	end_id = f"END {repeat}"
	# repeat -> first <- real_input
	# ...becomes...
	# real_input -> start -> first
	first, firsth = self.out_edges[repeat]["output"][0]
	[(real_input, real_inputh)] = [
	k for k in self.in_edges[first][firsth] if k != (repeat, "output")
	]
	self.dependencies[first].remove(repeat)
	self.dependencies[first].append(start_id)
	self.dependencies[start_id] = [real_input]
	self.out_edges[real_input][real_inputh] = [
	k if k != (first, firsth) else (start_id, "input")
	for k in self.out_edges[real_input][real_inputh]
	]
	self.in_edges[start_id] = {"input": [(real_input, real_inputh)]}
	self.out_edges[start_id] = {"output": [(first, firsth)]}
	self.in_edges[first][firsth] = [(start_id, "output")]
	# repeat <- last -> real_output
	# ...becomes...
	# last -> end -> real_output
	last, lasth = self.in_edges[repeat]["input"][0]
	[(real_output, real_outputh)] = [
	k for k in self.out_edges[last][lasth] if k != (repeat, "input")
	]
	del self.dependencies[repeat]
	self.dependencies[end_id] = [last]
	self.dependencies[real_output].append(end_id)
	self.out_edges[last][lasth] = [(end_id, "input")]
	self.in_edges[end_id] = {"input": [(last, lasth)]}
	self.out_edges[end_id] = {"output": [(real_output, real_outputh)]}
	self.in_edges[real_output][real_outputh] = [
	k if k != (last, lasth) else (end_id, "output")
	for k in self.in_edges[real_output][real_outputh]
	]
	self.inv_dependencies = {n: [] for n in self.dependencies}
	for k, v in self.dependencies.items():
	for i in v:
	self.inv_dependencies[i].append(k)
	self.sizes = {}
	for k, i in inputs.items():
	self.sizes[k] = i.shape[-1]
	self.layers = []

	def all_upstream(self, node: str) -> set[str]:
	"""Returns all nodes upstream of a node."""
	deps = set()
	for dep in self.dependencies[node]:
	deps.add(dep)
	deps.update(self.all_upstream(dep))
	return deps

	def all_downstream(self, node: str) -> set[str]:
	"""Returns all nodes downstream of a node."""
	deps = set()
	for dep in self.inv_dependencies[node]:
	deps.add(dep)
	deps.update(self.all_downstream(dep))
	return deps

	def run_node(self, node_id: str) -> None:
	"""Adds the layer(s) produced by this node to self.layers."""
	if node_id.startswith("START "):
	node = self.nodes[node_id.removeprefix("START ")]
	elif node_id.startswith("END "):
	node = self.nodes[node_id.removeprefix("END ")]
	else:
	node = self.nodes[node_id]
	t = node.data.title
	op = self.catalog[t]
	p = op.convert_params(node.data.params)
	inputs = {}
	for n in self.in_edges.get(node_id, []):
	for b, h in self.in_edges[node_id][n]:
	i = _to_id(b, h)
	inputs[n] = i
	outputs = {}
	for out in self.out_edges.get(node_id, []):
	i = _to_id(node_id, out)
	outputs[out] = i
	match t:
	case "Repeat":
	if node_id.startswith("END "):
	repeat_id = node_id.removeprefix("END ")
	start_id = f"START {repeat_id}"
	print(f"repeat {repeat_id} ending")
	after_start = self.all_downstream(start_id)
	after_end = self.all_downstream(node_id)
	before_end = self.all_upstream(node_id)
	affected_nodes = after_start - after_end - {node_id}
	repeated_nodes = after_start & before_end
	assert affected_nodes == repeated_nodes, (
	f"edges leave repeated section '{repeat_id}':\n{affected_nodes - repeated_nodes}"
	)
	for n in repeated_nodes:
	print(f"repeating {n}")
	case "Optimizer" \| "Input: tensor" \| "Input: graph edges" \| "Input: sequential":
	return
	layer = self.run_op(op, p, inputs, outputs)
	layer._origin_id = node_id
	self.layers.append(layer)

	def run_op(self, op, params, inputs: dict[str, str], outputs: dict[str, str]) -> Layer:
	"""Returns the layer produced by this op."""
	op_inputs = [
	TensorRef(inputs[i], shape=self.sizes.get(inputs[i], 1)) for i in op.inputs.keys()
	]
	if op.func != ops.no_op:
	layer = op.func(op_inputs, *params)
	else:
	layer = Layer(torch.nn.Identity(), shapes=[i.shape for i in op_inputs])
	layer._inputs = op_inputs
	layer._outputs = []
	for o, shape in zip(op.outputs.keys(), layer.shapes):
	layer._outputs.append(TensorRef(outputs[o], shape=shape))
	self.sizes[outputs[o]] = shape
	return layer

	def build_model(self) -> ModelConfig:
	# Walk the graph in topological order.
	ts = graphlib.TopologicalSorter(self.dependencies)
	for node_id in ts.static_order():
	self.run_node(node_id)
	return self.get_config()

	def get_config(self) -> ModelConfig:
	# Split the design into model and loss.
	loss_nodes = set()
	for node_id in self.nodes:
	if "loss" in self.nodes[node_id].data.title:
	loss_nodes.add(node_id)
	loss_nodes \|= self.all_downstream(node_id)
	layers = []
	loss_layers = []
	for layer in self.layers:
	if layer._origin_id in loss_nodes:
	loss_layers.append(layer)
	else:
	layers.append(layer)
	used_in_model = set(input._id for layer in layers for input in layer._inputs)
	used_in_loss = set(input._id for layer in loss_layers for input in layer._inputs)
	made_in_model = set(output._id for layer in layers for output in layer._outputs)
	made_in_loss = set(output._id for layer in loss_layers for output in layer._outputs)
	layers = [layer._for_sequential() for layer in layers]
	loss_layers = [layer._for_sequential() for layer in loss_layers]
	cfg = {}
	cfg["model_inputs"] = list(used_in_model - made_in_model)
	cfg["model_outputs"] = list(made_in_model & used_in_loss)
	cfg["loss_inputs"] = list(used_in_loss - made_in_loss)
	# Make sure the trained output is output from the last model layer.
	outputs = ", ".join(cfg["model_outputs"])
	layers.append((torch.nn.Identity(), f"{outputs} -> {outputs}"))
	# Create model.
	cfg["model"] = pyg.nn.Sequential(", ".join(cfg["model_inputs"]), layers)
	# Make sure the loss is output from the last loss layer.
	[(lossb, lossh)] = self.in_edges[self.optimizer]["loss"]
	lossi = _to_id(lossb, lossh)
	loss_layers.append((torch.nn.Identity(), f"{lossi} -> loss"))
	# Create loss function.
	cfg["loss"] = pyg.nn.Sequential(", ".join(cfg["loss_inputs"]), loss_layers)
	assert not list(cfg["loss"].parameters()), f"loss should have no parameters: {loss_layers}"
	# Create optimizer.
	op = self.catalog["Optimizer"]
	p = op.convert_params(self.nodes[self.optimizer].data.params)
	o = getattr(torch.optim, p["type"].name)
	cfg["optimizer"] = o(cfg["model"].parameters(), lr=p["lr"])
	print(cfg)
	return ModelConfig(**cfg)


	def to_tensors(b: core.Bundle, m: ModelMapping \| None) -> dict[str, torch.Tensor]:
	"""Converts a tensor to the correct type for PyTorch. Ignores missing mappings."""
	if m is None:
	return {}
	tensors = {}
	for k, v in m.map.items():
	if v.df in b.dfs and v.column in b.dfs[v.df]:
	tensors[k] = torch.tensor(b.dfs[v.df][v.column].to_list(), dtype=torch.float32)
	return tensors