— Tilly Engineer Skills

A service record for AI coding work

Your agent changed the repo. Can your team prove why?

A service record for AI coding work: rules, context, checks, evidence, and rollback kept inside the repository.

TES turns AI coding sessions into inspectable local records: the rules used, context loaded, checks run, evidence kept, and rollback path stay inside the repository.

Service recordRetained evidence
DashboardGate results
MemoryVersioned Markdown
InstallGitHub npx
01

Do not buy the chat log

A transcript is not a dashboard, service history, inspection report, or recovery plan. If an agent changes a real repository, the team needs more than a confident answer.

The risk

The agent changes code and the reason disappears into a chat window.

The demand

A team needs to see which rules, context, checks, and limits governed the work.

The shift

TES keeps that operating record inside the repository instead of in memory or folklore.

02

What the system leaves behind

The pitch is simple because the machinery is local: every useful part of the run has somewhere inspectable to land.

Service record

Retained evidence, changed-file inventory, gate results, and rollback guidance.

Dashboard

Statuses such as PASS, BLOCKED, DEGRADED, NEEDS_REVIEW, and recovered context.

Memory

Versioned Markdown under docs/agents/**, with Cortex recall as a derived access path.

Safety lane

No default push, publish, remote mutation, marketplace action, or write-capable MCP.

03

Proof without theater

A good seller shows the inspection report. TES keeps claims narrow enough to be trusted and explicit enough to be checked.

  • Retained v1 evidence shows up to 6x baseline disciplined behavior in scoped Claude CLI evals.
  • Codex has scoped retained behavior evidence for the named run, backend, model, and instruction contract.
  • Cursor is structural/contract parity only. Cursor behavior certification is not claimed.
  • The repository currently keeps retained evidence reports under docs/evidence/reports/**; the page avoids fixed report counts that drift.
04

GitHub npx quickstart

Installation is not the dream; it is the controlled path to the dream. Start with one GitHub package-spec command, then let the first agent session finish setup with evidence.

npx --loglevel=error -y --package github:murillodutt/tilly-engineer-skills#v0.3.105 tilly-engineer-skills add
bunx --silent --bun --package github:murillodutt/tilly-engineer-skills#v0.3.105 tilly-engineer-skills add
npx --loglevel=error -y --package github:murillodutt/tilly-engineer-skills#v0.3.105 tilly-engineer-skills add --agent all --yes
  1. Run from the target repository with Node.js 18+ and npx, or Bun 1.0+ and bunx. TES also requires Python 3.11+ for local setup oracles.
  2. Interactive mode lets you confirm target, agent hooks, and install mode before TES writes files.
  3. Use --agent all --yes when you want all Codex, Claude Code, and Cursor hooks prepared non-interactively.
  4. Codex: open Settings > Hooks, then Trust and enable the Session Start hook if it is marked needs review.
  5. Claude Code: open or reopen Claude Code, wait for the TES completion notice, then run /tes-setup.
  6. Cursor: reopen the workspace, let first-session setup complete, then run /tes-setup for the report.
  7. After /tes-setup reports complete, run /tes-align, then use /tes-map for the current GPS view before starting project work.
  8. Read the final report before approving commit, push, or rollout.

#v0.3.105 is the fixed reproducible Git ref and the supported install channel for this release. Use the versioned command when you need the same installer behavior across machines and time.

--loglevel=error keeps package-runner warnings out of the first-run screen while preserving real command failures. For Bun-only machines, use the bunx --silent --bun command. If neither runtime is installed, install Node.js LTS or Bun before running TES.

05

When you want the keys

The landing makes the case. The manual gives the operating path: install, update, audit, report review, and rollback without blind file copying.

Try

Run the GitHub npx command from the target repository, open your agent, wait for the hook, run /tes-setup, run /tes-align, then use /tes-map for the current GPS view before project work.

Operate

Use the manual when you need routes, states, rollback, MCP, Field Reports, or Obsidian viewing.

Audit

Use the source map when a claim needs evidence, scope, or a governed document.

06

Canonical source map

The user manual is the top CTA. This map traces each public TES promise to the governed source that proves, scopes, or operates it.

Method

Why agent rules become measurable engineering behavior instead of rule folklore.

Runtime surfaces

How Codex, Claude Code, and Cursor share one contract without pretending to be identical.

Install and safety

How TES enters a real repository through GitHub npx with local install records, first-session hooks, and rollback evidence.

  • GitHub npx installationFixed #v0.3.105 command, first-session hooks, and certification output.
  • Command triggersPost-install /tes-* vocabulary, aliases, routers, and write behavior.
  • Git safetyLocal baseline, backup, rollback, no push, no publish, and artifact hygiene.
  • Local quality recipeStaged-file routing, local hooks, and commit:check as closure gate.
  • Public bundle manifestVersioned ZIP, source commit, SHA-256, and GitHub Pages distribution URLs.artifact

Memory and feedback

How the trail survives beyond one chat window and returns as inspectable project context.

  • Cortex continuityFilesystem-first Markdown memory; SQLite, MCP, and Obsidian are derived access surfaces.
  • Read-only Cortex MCPProject-scoped recall and inspection without write-capable memory tools.
  • Field ReportsSanitized local operational feedback, optional GitHub drain, and quarantine rules.

Proof and boundaries

Where TES states what passed, what is scoped, and what must not be claimed.

Source governance

How the public page, machine map, and governed docs stay traceable.

  • Docs indexHuman map of active docs, public surfaces, distribution artifacts, and source boundaries.
  • TDS specDocument classes, evidence levels, source-of-truth rules, and validation contract.
  • Machine-readable mapOptional public navigation map for tools and answer engines.machine map
— Tilly Engineer Skills

Un registro de servicio para trabajo con IA

Tu agente cambio el repo. Tu equipo puede probar por que?

Un registro de servicio para trabajo de agentes: reglas, contexto, checks, evidencia y rollback dentro del repo.

TES convierte sesiones de agentes en registros locales inspeccionables: reglas usadas, contexto cargado, checks ejecutados, evidencia retenida y ruta de rollback quedan dentro del repositorio.

RegistroEvidencia retenida
PanelResultados de gates
MemoriaMarkdown versionado
InstalarGitHub npx
01

No compres el chat log

Una transcripcion no es panel, historial de servicio, inspeccion ni plan de recuperacion. Si un agente cambia un repositorio real, el equipo necesita mas que una respuesta confiada.

El riesgo

El agente cambia codigo y el motivo desaparece en una ventana de chat.

La exigencia

Un equipo necesita ver que reglas, contexto, checks y limites gobernaron el trabajo.

El cambio

TES conserva ese registro operativo dentro del repositorio, no en memoria ni folklore.

02

Lo que el sistema deja atras

La venta es simple porque la maquinaria es local: cada parte util de la ejecucion tiene un lugar inspeccionable donde quedar.

Registro de servicio

Evidencia retenida, inventario de archivos, resultados de gates y rollback.

Panel

Estados como PASS, BLOCKED, DEGRADED, NEEDS_REVIEW y contexto recuperado.

Memoria

Markdown versionado en docs/agents/**, con Cortex recall como acceso derivado.

Carril seguro

Sin push, publish, mutacion remota, marketplace o MCP con escritura por defecto.

03

Prueba sin teatro

Un buen vendedor muestra el reporte de inspeccion. TES mantiene claims estrechos para que puedan confiarse y revisarse.

  • La evidencia v1 retenida muestra hasta 6x baseline disciplined behavior en evaluaciones Claude CLI acotadas.
  • Codex tiene evidencia retenida acotada para el run, backend, modelo y contrato de instruccion nombrados.
  • Cursor es solo paridad estructural/contractual. No se afirma certificacion de comportamiento de Cursor.
  • El repositorio conserva reportes bajo docs/evidence/reports/**; la pagina evita conteos fijos que se desactualizan.
04

Quickstart con GitHub npx

La instalacion no es el sueno; es el camino controlado hacia el sueno. Empieza con un comando GitHub package-spec y deja que la primera sesion del agente termine el setup con evidencia.

npx --loglevel=error -y --package github:murillodutt/tilly-engineer-skills#v0.3.105 tilly-engineer-skills add
bunx --silent --bun --package github:murillodutt/tilly-engineer-skills#v0.3.105 tilly-engineer-skills add
npx --loglevel=error -y --package github:murillodutt/tilly-engineer-skills#v0.3.105 tilly-engineer-skills add --agent all --yes
  1. Ejecuta desde el repositorio objetivo con Node.js 18+ y npx, o Bun 1.0+ y bunx. TES tambien requiere Python 3.11+ para los oraculos locales de setup.
  2. El modo interactivo te deja confirmar target, hooks de agentes y modo de instalacion antes de escribir archivos.
  3. Usa --agent all --yes cuando quieras preparar hooks para Codex, Claude Code y Cursor de forma no interactiva.
  4. Codex: abre Settings > Hooks, luego usa Trust y activa el hook Session Start si aparece como needs review.
  5. Claude Code: abre o reabre Claude Code, espera el aviso de finalizacion de TES y ejecuta /tes-setup.
  6. Cursor: reabre el workspace, deja que el setup de primera sesion termine y ejecuta /tes-setup para el reporte.
  7. Despues de que /tes-setup reporte complete, ejecuta /tes-align y usa /tes-map para la vista GPS actual antes de empezar trabajo de proyecto.
  8. Lee el reporte final antes de aprobar commit, push o rollout.

#v0.3.105 es el Git ref fijo y reproducible y el canal de instalacion soportado para esta release. Usa el comando versionado cuando necesites el mismo comportamiento del instalador entre maquinas y momentos.

--loglevel=error mantiene los avisos del package runner fuera de la primera pantalla sin ocultar fallas reales del comando. En maquinas solo con Bun, usa bunx --silent --bun. Si no hay runtime instalado, instala Node.js LTS o Bun antes de ejecutar TES.

05

Cuando quieres las llaves

La landing convence. El manual da la ruta operativa: instalacion, update, auditoria, revision de reportes y rollback sin copia ciega.

Probar

Ejecuta el comando GitHub npx desde el repositorio objetivo, abre tu agente, espera el hook, ejecuta /tes-setup, luego /tes-align y usa /tes-map para la vista GPS actual antes del trabajo de proyecto.

Operar

Usa el manual para rutas, estados, rollback, MCP, Field Reports u Obsidian.

Auditar

Usa el mapa de fuentes cuando un claim necesita evidencia, alcance o documento gobernado.

06

Mapa de fuentes canonicas

El manual de usuario ya es el CTA principal. Este mapa conecta cada promesa publica de TES con la fuente gobernada que la prueba, delimita u opera.

Metodo

Por que las reglas de agentes se vuelven comportamiento medible, no folklore de reglas.

Superficies runtime

Como Codex, Claude Code y Cursor comparten un contrato sin fingir que son identicos.

Instalacion y seguridad

Como TES entra en un repositorio real por npx desde GitHub con registro local de instalacion, hooks de primera sesion y evidencia de rollback.

Memoria y feedback

Como el rastro sobrevive a una ventana de chat y vuelve como contexto inspeccionable.

  • Continuidad CortexMemoria Markdown filesystem-first; SQLite, MCP y Obsidian son superficies derivadas.
  • Cortex MCP read-onlyRecall e inspeccion con escopo de proyecto, sin herramientas de escritura de memoria.
  • Field ReportsFeedback operacional local sanitizado, drain GitHub opcional y reglas de cuarentena.

Prueba y limites

Donde TES declara que paso, que es escopado y que no debe afirmarse.

Gobernanza de fuente

Como la pagina publica, el mapa machine-readable y los docs gobernados permanecen trazables.

  • Indice de docsMapa humano de docs activos, superficies publicas, artefactos de distribucion y limites de fuente.
  • Spec TDSClases documentales, niveles de evidencia, reglas source-of-truth y contrato de validacion.
  • Mapa machine-readableMapa publico opcional para herramientas y answer engines.machine map
— Tilly Engineer Skills

Um registro de servico para trabalho de IA

Seu agente alterou o repo. Sua equipe consegue provar por que?

Um registro de servico para trabalho de agentes: regras, contexto, checks, evidencia e rollback dentro do repo.

TES transforma sessoes de agentes em registros locais inspecionaveis: regras usadas, contexto carregado, checks executados, evidencia retida e rota de rollback ficam dentro do repositorio.

RegistroEvidencia retida
PainelResultado dos gates
MemoriaMarkdown versionado
InstalarGitHub npx
01

Nao compre o chat log

Uma transcricao nao e painel, historico de servico, inspecao nem plano de recuperacao. Se um agente altera um repositorio real, a equipe precisa de mais que uma resposta confiante.

O risco

O agente muda codigo e o motivo desaparece em uma janela de chat.

A exigencia

A equipe precisa ver quais regras, contexto, checks e limites governaram o trabalho.

A virada

TES preserva esse registro operacional dentro do repositorio, nao na memoria nem no folklore.

02

O que o sistema deixa para tras

A venda e simples porque a mecanica e local: cada parte util da execucao tem um lugar inspecionavel para ficar.

Registro de servico

Evidencia retida, inventario de arquivos alterados, resultado dos gates e rollback.

Painel

Estados como PASS, BLOCKED, DEGRADED, NEEDS_REVIEW e contexto recuperado.

Memoria

Markdown versionado em docs/agents/**, com Cortex recall como acesso derivado.

Faixa segura

Sem push, publish, mutacao remota, marketplace ou MCP com escrita por padrao.

03

Prova sem teatro

Um bom vendedor mostra o relatorio de inspecao. TES mantem claims estreitos o bastante para serem confiaveis e verificaveis.

  • A evidencia v1 retida mostra ate 6x baseline disciplined behavior em evals Claude CLI escopados.
  • Codex tem evidencia comportamental retida e escopada para o run, backend, modelo e contrato de instrucao nomeados.
  • Cursor e apenas paridade estrutural/contratual. Certificacao de comportamento do Cursor nao e afirmada.
  • O repositorio mantem relatorios retidos em docs/evidence/reports/**; a pagina evita contagens fixas que derivam.
04

Quickstart com GitHub npx

Instalacao nao e o sonho; e o caminho controlado ate o sonho. Comece com um comando GitHub package-spec e deixe a primeira sessao do agente terminar o setup com evidencia.

npx --loglevel=error -y --package github:murillodutt/tilly-engineer-skills#v0.3.105 tilly-engineer-skills add
bunx --silent --bun --package github:murillodutt/tilly-engineer-skills#v0.3.105 tilly-engineer-skills add
npx --loglevel=error -y --package github:murillodutt/tilly-engineer-skills#v0.3.105 tilly-engineer-skills add --agent all --yes
  1. Rode a partir do repositorio alvo com Node.js 18+ e npx, ou Bun 1.0+ e bunx. O TES tambem exige Python 3.11+ para os oraculos locais de setup.
  2. O modo interativo deixa confirmar target, hooks de agentes e modo de instalacao antes de escrever arquivos.
  3. Use --agent all --yes quando quiser preparar hooks para Codex, Claude Code e Cursor de forma nao interativa.
  4. Codex: abra Settings > Hooks, depois use Trust e ative o hook Session Start se ele aparecer como needs review.
  5. Claude Code: abra ou reabra o Claude Code, aguarde o aviso de conclusao do TES e rode /tes-setup.
  6. Cursor: reabra o workspace, deixe o setup de primeira sessao terminar e rode /tes-setup para o relatorio.
  7. Depois que /tes-setup reportar complete, rode /tes-align e use /tes-map para a visao GPS atual antes de iniciar trabalho no projeto.
  8. Leia o relatorio final antes de aprovar commit, push ou rollout.

#v0.3.105 e o Git ref fixo e reprodutivel e o canal de instalacao suportado para esta release. Use o comando versionado quando precisar do mesmo comportamento do instalador entre maquinas e momentos.

--loglevel=error mantem avisos do package runner fora da primeira tela sem esconder falhas reais do comando. Em maquinas somente com Bun, use bunx --silent --bun. Se nenhum runtime estiver instalado, instale Node.js LTS ou Bun antes de executar o TES.

05

Quando voce quer as chaves

A landing convence. O manual entrega o caminho operacional: instalacao, update, auditoria, revisao de relatorios e rollback sem copia cega.

Testar

Rode o comando GitHub npx a partir do repositorio alvo, abra seu agente, aguarde o hook, rode /tes-setup, depois /tes-align e use /tes-map para a visao GPS atual antes do trabalho no projeto.

Operar

Use o manual para rotas, estados, rollback, MCP, Field Reports ou Obsidian.

Auditar

Use o mapa de fontes quando um claim precisar de evidencia, escopo ou documento governado.

06

Mapa de fontes canonicas

O manual do usuario ja e o CTA principal. Este mapa liga cada promessa publica de TES a fonte governada que prova, delimita ou opera aquela promessa.

Metodo

Por que regras de agentes viram comportamento de engenharia mensuravel, nao folklore de regras.

Superficies runtime

Como Codex, Claude Code e Cursor compartilham um contrato sem fingir que sao identicos.

Instalacao e seguranca

Como TES entra em um repositorio real por npx direto do GitHub com registro local de instalacao, hooks de primeira sessao e evidencia de rollback.

Memoria e feedback

Como o rastro sobrevive a uma janela de chat e retorna como contexto inspecionavel.

  • Continuidade CortexMemoria Markdown filesystem-first; SQLite, MCP e Obsidian sao superficies derivadas.
  • Cortex MCP read-onlyRecall e inspecao com escopo de projeto, sem ferramentas de escrita de memoria.
  • Field ReportsFeedback operacional local sanitizado, drain GitHub opcional e regras de quarentena.

Prova e limites

Onde TES declara o que passou, o que e escopado e o que nao deve ser afirmado.

Governanca de fonte

Como a pagina publica, o mapa machine-readable e os docs governados seguem rastreaveis.

  • Indice de docsMapa humano de docs ativos, superficies publicas, artefatos de distribuicao e limites de fonte.
  • Spec TDSClasses documentais, niveis de evidencia, regras source-of-truth e contrato de validacao.
  • Mapa machine-readableMapa publico opcional para ferramentas e answer engines.machine map