Script

yaml
type: "io.kestra.plugin.scripts.python.script"

Examples

yaml
id: python_demo
namespace: company.team

tasks:
  - id: python
    type: io.kestra.plugin.scripts.python.Script
    dependencies:
      - requests
      - kestra
    script: |
      from kestra import Kestra
      import requests

      response = requests.get('https://kestra.io')
      print(response.status_code)

      Kestra.outputs({'status': response.status_code, 'text': response.text})

yaml
id: pip_packages_docker
namespace: company.team

tasks:
  - id: run_python
    type: io.kestra.plugin.scripts.python.Script
    dependencies:
      - requests
    script: |
      import requests
      import json

      response = requests.get("https://api.github.com")
      data = response.json()
      print(data)

yaml
id: python_logs
namespace: company.team

tasks:
  - id: python_logger
    type: io.kestra.plugin.scripts.python.Script
    allowFailure: true
    dependencies
      - kestra
    script: |
      import time
      from kestra import Kestra

      logger = Kestra.logger()

      logger.debug("DEBUG is used for diagnostic info.")
      time.sleep(0.5)

      logger.info("INFO confirms normal operation.")
      time.sleep(0.5)

      logger.warning("WARNING signals something unexpected.")
      time.sleep(0.5)

      logger.error("ERROR indicates a serious issue.")
      time.sleep(0.5)

      logger.critical("CRITICAL means a severe failure.")

yaml
id: pass_data_between_tasks
namespace: company.team

tasks:
  - id: download
    type: io.kestra.plugin.core.http.Download
    uri: https://huggingface.co/datasets/kestra/datasets/raw/main/csv/orders.csv

  - id: python
    type: io.kestra.plugin.scripts.python.Script
    script: |
      with open('{{ outputs.download.uri }}', 'r') as f:
        print(f.read())

yaml
id: python_output_file
namespace: company.team

tasks:
  - id: python
    type: io.kestra.plugin.scripts.python.Script
    outputFiles:
      - "myfile.txt"
    script: |
      f = open("myfile.txt", "a")
      f.write("Hello from a Kestra task!")
      f.close()

yaml
id: python_outputs
namespace: company.team

tasks:
  - id: clean_dataset
    type: io.kestra.plugin.scripts.python.Script
    containerImage: ghcr.io/kestra-io/pydata:latest
    outputFiles:
      - "clean_dataset.csv"
    dependencies:
      - pandas
    script: |
      import pandas as pd
      df = pd.read_csv("https://huggingface.co/datasets/kestra/datasets/raw/main/csv/messy_dataset.csv")

      # Replace non-numeric age values with NaN
      df["Age"] = pd.to_numeric(df["Age"], errors="coerce")

      # mean imputation: fill NaN values with the mean age
      mean_age = int(df["Age"].mean())
      print(f"Filling NULL values with mean: {mean_age}")
      df["Age"] = df["Age"].fillna(mean_age)
      df.to_csv("clean_dataset.csv", index=False)

  - id: read_file_from_python
    type: io.kestra.plugin.scripts.shell.Commands
    taskRunner:
      type: io.kestra.plugin.core.runner.Process
    commands:
      - head -n 10 {{ outputs.clean_dataset.outputFiles['clean_dataset.csv'] }}

yaml
id: python_use_input_in_inline
namespace: company.team

inputs:
  - id: pokemon
    type: STRING
    defaults: pikachu

  - id: your_age
    type: INT
    defaults: 25

tasks:
  - id: inline_script
    type: io.kestra.plugin.scripts.python.Script
    description: Fetch the pokemon detail and compare its experience
    containerImage: ghcr.io/kestra-io/pydata:latest
    dependencies:
      - requests
    script: |
      import requests
      import json

      url = "https://pokeapi.co/api/v2/pokemon/{{ inputs.pokemon }}"
      response = requests.get(url)

      if response.status_code == 200:
          pokemon = json.loads(response.text)
          print(f"Base experience of {{ inputs.pokemon }} is { pokemon.get('base_experience') }")
          if pokemon.get('base_experience') > int("{{ inputs.your_age }}"):
              print("{{ inputs.pokemon }} has more base experience than your age")
          else:
              print("{{ inputs.pokemon}} is too young!")
      else:
          print(f"Failed to retrieve the webpage. Status code: {response.status_code}")

yaml
id: python_input_file
namespace: company.team

tasks:
  - id: download_file
    type: io.kestra.plugin.core.http.Download
    uri: https://huggingface.co/datasets/kestra/datasets/raw/main/csv/orders.csv

  - id: get_total_rows
    type: io.kestra.plugin.scripts.python.Script
    dependencies:
      - pandas
    inputFiles:
      input.csv: "{{ outputs.download_file.uri }}"
    script: |
      import pandas as pd

      # Path to your CSV file
      csv_file_path = "input.csv"

      # Read the CSV file using pandas
      df = pd.read_csv(csv_file_path)

      # Get the number of rows
      num_rows = len(df)

      print(f"Number of rows: {num_rows}")

yaml
id: python_generate_outputs
namespace: company.team

tasks:
  - id: generate_output
    type: io.kestra.plugin.scripts.python.Script
    packageManager: PIP
    dependencies:
      - kestra
    script: |
      from kestra import Kestra

      marks = [79, 91, 85, 64, 82]
      Kestra.outputs({"total_marks": sum(marks),"average_marks": sum(marks)/len(marks)})

  - id: log_result
    type: io.kestra.plugin.core.log.Log
    message:
      - "Total Marks: {{ outputs.generate_output.vars.total_marks }}"
      - "Average Marks: {{ outputs.generate_output.vars.average_marks }}"

Properties

script *string

beforeCommands array

SubType string

containerImage string

Default python:3.13-slim

dependencies array

SubType string

dependencyCacheEnabled booleanstring

env object

SubType string

failFast booleanstring

Default true

inputFiles objectstring

interpreter array

SubType string

Default ["/bin/sh","-c"]

namespaceFiles NamespaceFiles

outputFiles array

SubType string

packageManager string

Default UV

Possible Values

PIPUV

pythonVersion string

targetOS string

Default AUTO

Possible Values

LINUXWINDOWSAUTO

taskRunner Docker Process Batch Kubernetes Batch Batch CloudRun

Outputs

exitCode integer

Default 0

outputFiles object

SubType string

taskRunner TaskRunnerDetailResult

vars object

Definitions

io.kestra.plugin.ee.kubernetes.runner.SideCar

image string

Default busybox

io.kestra.plugin.scripts.runner.docker.Cpu

cpus numberstring

io.kestra.plugin.ee.kubernetes.runner.Kubernetes-Resource

cpu string

memory string

io.kestra.plugin.ee.kubernetes.runner.Kubernetes-Resources

limit Kubernetes-Resource

request Kubernetes-Resource

Credentials for a private container registry.

auth string

identityToken string

password string

registry string

registryToken string

username string

io.kestra.plugin.ee.azure.batch.models.ComputeNodeIdentityReference

resourceId string

io.kestra.plugin.ee.gcp.runner.Batch-ComputeResource

bootDisk string

cpu string

memory string

io.kestra.plugin.ee.aws.runner.Batch-Resources

request *Batch-Resource

io.kestra.plugin.ee.kubernetes.models.OAuthTokenProvider

output string

task Task

io.kestra.core.models.tasks.NamespaceFiles

enabled booleanstring

Default true

exclude array

SubType string

folderPerNamespace booleanstring

Default false

ifExists string

Default OVERWRITE

Possible Values

OVERWRITEFAILWARNIGNORE

include array

SubType string

namespaces array

SubType string

Default ["{{flow.namespace}}"]

Task runner that executes a task inside a pod in a Kubernetes cluster.

type *object

config Connection

containerSpec object

delete booleanstring

Default true

fileSideCarSpec object

fileSidecar SideCar

Default

{
  "image": "busybox"
}

labels object

namespace string

Default default

nodeSelector object

podSpec object

pullPolicy string

Default ALWAYS

Possible Values

IF_NOT_PRESENTALWAYSNEVER

resources Kubernetes-Resources

resume booleanstring

Default true

serviceAccountName string

version string

Validation RegExp \d+\.\d+\.\d+(-[a-zA-Z0-9-]+)?|([a-zA-Z0-9]+)

waitForLogs string

Default PT5S

Format duration

waitUntilCompletion string

Default PT1H

Format duration

waitUntilRunning string

Default PT10M

Format duration

io.kestra.core.models.tasks.runners.TaskRunnerDetailResult

Task runner that executes a task inside a job in Azure Batch.

accessKey *string

account *string

endpoint *string

poolId *string

type *object

blobStorage BlobStorageForBatch

completionCheckInterval string

Default PT5S

Format duration

delete booleanstring

Default true

registry ContainerRegistry

resume booleanstring

Default true

streamLogs booleanstring

Default false

version string

Validation RegExp \d+\.\d+\.\d+(-[a-zA-Z0-9-]+)?|([a-zA-Z0-9]+)

waitUntilCompletion string

Default PT1H

Format duration

io.kestra.plugin.ee.gcp.runner.Batch-LifecyclePolicyAction

exitCodes array

SubType integer

Task runner that executes a task inside a job in Google Cloud Run.

region *string

type *object

bucket string

completionCheckInterval string

Default PT5S

Format duration

delete booleanstring

Default true

projectId string

resume booleanstring

Default true

scopes array

SubType string

Default ["https://www.googleapis.com/auth/cloud-platform"]

serviceAccount string

version string

Validation RegExp \d+\.\d+\.\d+(-[a-zA-Z0-9-]+)?|([a-zA-Z0-9]+)

waitForLogInterval string

Default PT5S

Format duration

waitUntilCompletion string

Default PT1H

Format duration

io.kestra.plugin.ee.gcp.runner.Batch-LifecyclePolicy

action string

Possible Values

ACTION_UNSPECIFIEDRETRY_TASKFAIL_TASKUNRECOGNIZED

actionCondition Batch-LifecyclePolicyAction

io.kestra.plugin.ee.gcp.runner.Batch-NetworkInterface

network *string

subnetwork string

io.kestra.plugin.ee.aws.runner.Batch-Resource

cpu *string

memory *string

io.kestra.plugin.ee.kubernetes.models.Connection

apiVersion string

Default v1

caCertData string

caCertFile string

clientCertData string

clientCertFile string

clientKeyAlgo string

Default RSA

clientKeyData string

clientKeyFile string

clientKeyPassphrase string

disableHostnameVerification booleanstring

keyStoreFile string

keyStorePassphrase string

masterUrl string

Default https://kubernetes.default.svc

namespace string

oauthToken string

oauthTokenProvider OAuthTokenProvider

password string

trustCerts booleanstring

trustStoreFile string

trustStorePassphrase string

username string

io.kestra.plugin.ee.azure.storage.blob.models.BlobStorageForBatch

containerName *string

connectionString string

endpoint string

sharedKeyAccountAccessKey string

sharedKeyAccountName string

Task runner that executes a task as a subprocess on the Kestra host.

type *object

version string

Validation RegExp \d+\.\d+\.\d+(-[a-zA-Z0-9-]+)?|([a-zA-Z0-9]+)

Task runner that executes a task inside a job in Google Cloud Batch.

region *string

type *object

bucket string

completionCheckInterval string

Default PT5S

Format duration

computeResource Batch-ComputeResource

delete booleanstring

Default true

entryPoint array

SubType string

lifecyclePolicies array

SubType

machineType string

Default e2-medium

maxCreateJobRetryCount integerstring

Default 2

maxRetryCount integer

Minimum >= 0

Maximum <= 10

networkInterfaces array

SubType

projectId string

reservation string

resume booleanstring

Default true

scopes array

SubType string

Default ["https://www.googleapis.com/auth/cloud-platform"]

serviceAccount string

version string

Validation RegExp \d+\.\d+\.\d+(-[a-zA-Z0-9-]+)?|([a-zA-Z0-9]+)

waitForLogInterval string

Default PT5S

Format duration

waitUntilCompletion string

Default PT1H

Format duration

io.kestra.plugin.scripts.runner.docker.Memory

kernelMemory string

memory string

memoryReservation string

memorySwap string

memorySwappiness string

oomKillDisable booleanstring

io.kestra.plugin.ee.azure.batch.models.ContainerRegistry

identityReference ComputeNodeIdentityReference

password string

registryServer string

userName string

io.kestra.plugin.scripts.exec.scripts.models.DockerOptions

image *string

Min length 1

config stringobject

cpu Cpu

credentials Credentials

deviceRequests array

SubType

entryPoint array

SubType string

extraHosts array

SubType string

host string

memory Memory

networkMode string

privileged booleanstring

pullPolicy string

Default IF_NOT_PRESENT

Possible Values

IF_NOT_PRESENTALWAYSNEVER

shmSize string

user string

volumes array

SubType string

Run a task in a Docker container.

type *object

config stringobject

cpu Cpu

credentials Credentials

delete booleanstring

Default true

deviceRequests array

SubType

entryPoint array

SubType string

Default

[
  ""
]

extraHosts array

SubType string

fileHandlingStrategy string

Default VOLUME

Possible Values

MOUNTVOLUME

host string

killGracePeriod string

Default PT0S

Format duration

memory Memory

networkMode string

portBindings array

SubType string

privileged booleanstring

pullPolicy string

Default IF_NOT_PRESENT

Possible Values

IF_NOT_PRESENTALWAYSNEVER

shmSize string

user string

version string

Validation RegExp \d+\.\d+\.\d+(-[a-zA-Z0-9-]+)?|([a-zA-Z0-9]+)

volumes array

SubType string

wait booleanstring

Default true

A request for devices to be sent to device drivers.

capabilities array

SubType array

count integerstring

deviceIds array

SubType string

driver string

options object

SubType string

Task runner that executes a task inside a job in AWS Batch.

computeEnvironmentArn *string

region *string

type *object

accessKeyId string

bucket string

completionCheckInterval string

Default PT5S

Format duration

delete booleanstring

Default true

endpointOverride string

executionRoleArn string

jobQueueArn string

resources Batch-Resources

Default

{
  "request": {
    "memory": "2048",
    "cpu": "1"
  }
}

resume booleanstring

Default true

secretKeyId string

sessionToken string

stsEndpointOverride string

stsRoleArn string

stsRoleExternalId string

stsRoleSessionDuration string

Default PT15M

Format duration

stsRoleSessionName string

taskRoleArn string

version string

Validation RegExp \d+\.\d+\.\d+(-[a-zA-Z0-9-]+)?|([a-zA-Z0-9]+)

waitUntilCompletion string

Default PT1H

Format duration

​Script

Script